DXを推進するAIポータルメディア「AIsmiley」| AI製品・サービスの比較・検索サイト
03-6452-4750 10:00〜18:00 年末年始除く

GPT-4o miniとは?性能から料金まで詳しく解説

最終更新日:2024/10/17

ネットニュースでOpenAIが新しい「GPT-4o mini」という製品を発表したのを見たので仕事で使ってみたいけれど、何から始めてよいか分からず困っている人はいませんか?

安くて速いAIモデルが技術開発のトレンドとなっていることからも、GPT-4o miniはさまざまな分野での活用が期待されます。

この記事では、GPT-4o miniの性能から使い方、料金まで詳しく解説します。

ChatGPT連携サービスについて知りたい方はこちらをご覧ください。
ChatGPT連携のサービス比較と企業一覧

GPT-4o miniとは

2024年7月19日の日本経済新聞で、OpenAIが2024年7月18日に大規模言語モデルGPT-4o」の小型版にあたる「GPT-4o mini」を発表したことが報じられました。

GPT-4o miniの技術詳細が明かされていないため、この発表における「小型」が具体的に何を意味するかはわかっていません。

2024年8月現在、GPT-4o miniはAPI(ソフトウェア機能の一部を他のソフトウェアやプログラム上で使えるようつなぐ仕組み)でテキストと画像に対応しており、将来的にはテキスト・画像・ビデオ・オーディオの入出力にも対応する予定となっています。

OpenAIではAIの未来をよりアクセスしやすく、信頼性が高くなり日常のデジタル体験に取り組み込まれるようになると考えているため、GPT-4o miniはその第一歩を踏み出すモデルだと言えます。
参考:日本経済新聞「OpenAI、ChatGPTに小型AIモデル 利用料を6割安く」
参考:OpenAI「GPT-4o mini:コスト効率の高いインテリジェンスを進化させる」

GPT-4o miniの特徴

現在ChatGPTの中でも多く使用されているGPT-4o・GPT-3.5TurboとGPT-4o miniを比較すると特徴は以下のようになります。

GPT-4o mini GPT-4o GPT-3.5 Turbo
入力最大トークン数 ・12,8000トークン ・12,8000トークン ・入力と出力の合計が4096トークン
出力最大トークン数 ・16,383トークン ・32,768トークン ・入力と出力の合計が4096トークン
1メガ入力トークンあたりの料金 ・15セント ・5ドル ・3ドル
入力形式 ・テキストと画像(将来的にはテキスト・画像・動画・音声の入出力もサポート予定) ・テキストと画像 ・テキスト
無料プラン ・あり ・あり ・あり
学習データの最終更新日 ・2023年10月 ・2023年10月 ・2021年1月

また、さまざまな生成AIモデルの性能や特徴を客観的に比較・分析できるWebサイトAritificial Analysisでは、GPT-4o miniを他の生成AIモデルと比較してどのような特徴があるのかをデータで公表しています。

GPT-4o miniが他の生成AIモデルと比較して優れている特徴を3つご紹介します。

料金

画像出典:Artificial Analysis「Independent analysis of AI models and API providers」

上記のグラフは、APIに送信されるリクエストとメッセージに含まれるトークンあたりの料金(入力料金=青)と、各生成AIモデルによって生成された(APIから受信した)トークンあたりの料金(100万トークンあたりのUSD=出力料金=紫)を示しています。

GPT-4o miniは入力料金0.15アメリカンドル、出力料金0.6アメリカドルとGemini1.5 Frashに次ぐ低料金であるのがわかります。

料金が安いことで、試しに生成AIを活用してみたい、少しだけ使ってみたいといったライトユーザー層が持つニーズにも対応可能です。

出力速度

画像出典:Artificial Analysis「Independent analysis of AI models and API providers」

上記のグラフは、各生成AIモデルがトークンを生成している間に受信した1秒あたりのトークン数を示しています。GPT-4o miniの出力速度は、Gemini1.5 FlashやLlama3.1 8Bに次ぐ5位で113トークン/毎秒となっており、生成AIモデルの中でも速い方です。

GPT-4o miniは、AI使用にあまり多くの時間を割けない人にも使いやすい生成AIモデルだと言えます。

入力トークン数による出力速度

画像出典:Artificial Analysis「Independent analysis of AI models and API providers」

上記のグラフは、各生成AIモデルに100トークン(青)・1,000トークン(紫)・10,000トークン(緑)を入力したトークン数による出力速度の違いを表しています。

GPT-4o miniは、生成AIモデルの中では5位ですが、入力したトークン数による出力速度の違いが10前後とあまり大きくないのが特徴的だと言えます。

GPT-4o miniの性能

画像出典:OpenAI「GPT-4o mini:コスト効率の高いインテリジェンスを進化させる」

2024年7月18日にOpenAIはGPT-4o miniを発表しましたが、発信の中でAIモデルや機械学習システムの性能を評価するための基準や指標となるEval Benchmarkを用いて既存の生成AIモデルとの比較を行っています。

具体的には、上記のグラフでGPT-4o mini・Gemini Flash・Claude Haiku・GPT-3.5 Turbo・GPT-4oの5つの生成AIモデルを8種類のEval Benchmarkで比較されました。

以下では、次の8種類のEval Benchmarkにおける比較結果をご紹介します。

  • MMLU:テキスト理解や言語処理パフォーマンスの評価
  • GPQA:大学院レベルの専門的な知識と論理的思考の評価
  • DROP:推論能力の評価
  • MGSM:テキストや画像など異なる形式のデータを統合して処理する能力の評価
  • MATH:数学的な能力の評価
  • HumanEval:AIモデルがどの程度プログラムを書けるかの評価
  • MMMU:数学的理解と処理におけるマルチモーダル能力の評価
  • MathVista:数学的能力の評価

MMLUでの比較

MMLU(Massive Multitask Language Understanding)はテキスト理解や言語処理のパフォーマンスを評価するのを目的に設計されており、初等数学・米国史・コンピュータサイエンス・法律といった57種類の課題があります。

MMLUにおけるGPT-4o miniの精度は82.0%でGPT-4oに次ぐ高い数値であることから、質疑応答・文章の理解・文脈把握などに優れていると言えます。

GPQAでの比較

GPQA(General Purpose Question Answering)は、大学院レベルの専門的な知識と論理的思考を必要とする質問をすることでAIモデルの性能を評価します。

GPQAにおけるGPT-4o miniの精度は40.2%とGPT-4oに次ぐ数値を示しているため、幅広い質問に対応できる能力を持つと言えます。

DROPでの比較

DROP(Discrete Reasoning Over Paragraphs)は、推論の能力を図ることでAIモデルの性能を評価し、55,000問の問題が含まれていますが人間の正答率は96.4%です。

DROPにおけるGPT-4o miniの精度は79.7%で他のAIモデルと遜色のない高い数値を示しているため、質問の文脈から推論して正しい回答をする能力を持つと言えます。

MGSMでの比較

MGSM(Multimodal Generative and Selective Modeling)は、テキストや画像など異なる形式のデータを統合して処理する能力を計ることができます。

MGSMにおけるGPT-4o miniの精度は87.0%で1位のGPT-4oの90.5%に一番近い数字のため、複数のデータ形式の処理に優れた能力を発揮します。

MATHでの比較

MATH(Mathematics Benchmark)は、AIモデルの数学的な能力を評価します。

MATHにおけるGPT-4o miniの精度は70.2%で、1位のGPT-4oとともに他の生成AIモデルを大きく引き離しているため、数学的な問題解決能力は高いです。

HumanEvalでの比較

HumanEvalはAIモデルがどの程度プログラムを書けるかを測定できます。

HumanEvalにおけるGPT-4o miniの精度は87.2%で、1位のGPT-4oとも3%しか違わないため、プログラミング能力が高いと言えます。

MMMUでの比較

MMMU(Multimodal Model for Mathematical Understanding)は、主に数学的理解と処理におけるマルチモーダル能力(テキスト・数式・図形など複数のデータ形式を統合して数学的な問題を理解し解決する能力)を評価します。

MMMUにおけるGPT-4o miniの精度は59.4%ですが、1位のGPT-4oでも69.1%なのでこれからに期待です。

MathVistaでの比較

MathVistaはAIモデルの数学的能力(計算問題・代数的な問題・幾何学的な問題などの解決能力や問題の文脈を理解する能力、回答の生成や証明の能力)を評価することができます。

MathVistaにおけるGPT-4o miniの精度は56.7%ですが、1位のGPT-4oでも63.8%なので、こちらも今後に期待です。

GPT-4o miniの使い方

ここからは、GPT-4o miniの使い方として、以下の4つをご紹介します。

  • ChatGPT
  • Assistants API
  • Chat Completions API
  • Batch API

ChatGPTでの使い方

GPT-4o miniはChatGPTに搭載されているため、会話の最後に表示される星マークのプルダウンから選んで使うことができます。無料プランの場合は、GPT-4oに5時間に約10回の回数制限に達すると、自動的にGPT-4o miniに移行する仕組みです。

今までご紹介したGPT-4oとの違いを踏まえ、使い分けてみるのがおすすめです。

Assistants APIでの使い方

Assistants APIはChatGPTでの機能の1つです。自分だけのAIアシスタントを作れますが、アシスタントを作成する際に使用するChatGPTのベースモデルにGPT-4o miniも設定できるようになっています。

具体的には、Assistants APIのアシスタントについて、「Name(名前)」「Instructions(役割)」「Models(使用するChatGPTのモデル)」「Tools(連携するAPI)」の4項目を設定することとなっています。

自分のアシスタントへのニーズにGPT-4o miniが合っているかを確かめるためにも、設定を変えて一度使ってみるのがおすすめです。

Chat Completions APIでの使い方

Chat Completions APIはOpenAIのAPIの一部で、チャット形式の対話を生成できるためカスタマーサポート・チャットボット・対話型アプリケーションなどに利用されています。また、Chat Completions APIでは、文章生成に使うAIモデルにGPT-4o miniが設定できます。

Chat Completions APIを使った独自のチャットサービスなどを提供している場合、MMLUで文脈の理解や質疑応答に優れていると評価されたGPT-4o miniも試してみてください。

Batch APIでの使い方

Batch APIとは、OpenAIにおける複数のリクエストをまとめて処理できる機能です。例えば、ChatGPTは一問一答形式ですが、Batch APIを利用すると大量のリクエストを一度に送信し、24時間以内に結果を後でまとめて取得することができるようになります。

Batch APIでは、インプットデータを作成する際に使用するAIモデルを指定しますが、GPT-4o miniも選べるようになっています。

Batch APIを用いて多くの回答をChatGPTからもらいたい場合、GPQAで幅広い質問に対応できる能力を持つと評価された、GPT-4o miniを設定してみるのもおすすめです。

GPT-4oおよびGPT-4o miniのファインチューニングが可能に

2024年8月20日、OpenAIはGPT-4oのファインチューニング機能をリリースしました。これにより、特定のユースケースに合わせてGPT-4oをカスタマイズし、パフォーマンスや精度を向上させることが可能になります。

ファインチューニングのメリット

ファインチューニングを利用することで、モデルの応答の構造やトーンをカスタマイズしたり、固有の指示に従わせたりすることができます。

これにより、数十の例を含むトレーニングデータセットであっても、優れた結果を生み出すことが可能です。コード生成やクリエイティブライティングなど、さまざまな領域で大きなパフォーマンス向上が見込まれます。

GPT-4o miniもサポート開始

さらに、GPT-4o miniのファインチューニングも全ての開発者向けに提供され、こちらは2024年9月23日までに毎日200万トークン分の無料トレーニングが可能です。両モデルともに、少量のデータセットで大きなカスタマイズができるため、コストを抑えつつ高精度な結果を得られます。

導入方法と料金

ファインチューニングは、全ての有料利用者が利用可能で、ファインチューニングダッシュボードから簡単に始めることが可能です。モデル選択で「GPT-4o」または「GPT-4o mini」を選び、トレーニングを開始できます。

GPT-4oのファインチューニングには100万トークンあたり25ドル、推論には入力トークンあたり3.75ドル、出力トークンあたり15ドルの料金がかかります。

まとめ

GPT-4o miniとはChatGPTにおける「GPT-4o」の小型版にあたり、料金が安く出力速度も早いため、これからさまざまな場面で活躍するAIモデルとなることが期待されます。

この記事も参考にして、ぜひ自社に合った形でGPT-4o miniを活用してみてください。

ChatGPT連携サービスについて知りたい方は以下からご覧ください。

ChatGPT連携のサービス比較と企業一覧

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています
@AIsmiley.inc
・Xもフォローください
@AIsmiley_inc

メルマガに登録する

DXトレンドマガジン メールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

メールアドレス

メールアドレスを入力してください

AI・人工知能記事カテゴリ一覧

今注目のカテゴリー

ChatGPT連携サービス

チャットボット

画像認識・画像解析

需要予測

ChatGPT連携サービス

チャットボット

画像認識・画像解析

需要予測

AI活用のご相談したい企業様はこちら

03-6452-4750

AI製品・ソリューションの掲載を
希望される企業様はこちら