GPT-4o miniとは？性能から料金まで詳しく解説

最終更新日:2025/05/28

GPT-4o miniとは？

ネットニュースでOpenAIが新しい「GPT-4o mini」という製品を発表したのを見たので仕事で使ってみたいけれど、何から始めてよいか分からず困っている人はいませんか？

安くて速いAIモデルが技術開発のトレンドとなっていることからも、GPT-4o miniはさまざまな分野での活用が期待されます。

この記事では、GPT-4o miniの性能から使い方、料金まで詳しく解説します。

ChatGPT連携サービスについて知りたい方はこちらをご覧ください。
ChatGPT連携のサービス比較と企業一覧

GPT-4o miniとは

2024年7月19日の日本経済新聞で、OpenAIが2024年7月18日に大規模言語モデル「GPT-4o」の小型版にあたる「GPT-4o mini」を発表したことが報じられました。

GPT-4o miniの技術詳細が明かされていないため、この発表における「小型」が具体的に何を意味するかはわかっていません。

2024年8月現在、GPT-4o miniはAPI（ソフトウェア機能の一部を他のソフトウェアやプログラム上で使えるようつなぐ仕組み）でテキストと画像に対応しており、将来的にはテキスト・画像・ビデオ・オーディオの入出力にも対応する予定となっています。

OpenAIではAIの未来をよりアクセスしやすく、信頼性が高くなり日常のデジタル体験に取り組み込まれるようになると考えているため、GPT-4o miniはその第一歩を踏み出すモデルだと言えます。
参考：日本経済新聞「OpenAI、ChatGPTに小型AIモデル　利用料を6割安く」
参考：OpenAI「GPT-4o mini：コスト効率の高いインテリジェンスを進化させる」

GPT-4o miniの特徴

現在ChatGPTの中でも多く使用されているGPT-4oとGPT-4o miniを比較すると特徴は以下のようになります。

	GPT-4o mini	GPT-4o
入力最大トークン数	・12,8000トークン	・12,8000トークン
出力最大トークン数	・16,383トークン	・32,768トークン
1メガ入力トークンあたりの料金	・0.15ドル	・5ドル
入力形式	・テキストと画像（将来的にはテキスト・画像・動画・音声の入出力もサポート予定）	・テキストと画像
無料プラン	・あり	・あり
学習データの最終更新日	・2023年10月	・2023年10月

また、さまざまな生成AIモデルの性能や特徴を客観的に比較・分析できるWebサイトAritificial Analysisでは、GPT-4o miniを他の生成AIモデルと比較してどのような特徴があるのかをデータで公表しています。

GPT-4o miniが他の生成AIモデルと比較して優れている特徴を3つご紹介します。

GPT-4o miniは無料プランでもほぼ無制限で使用可能

GPT4o miniは無料プランでもほぼ無制限に使えます。

料金

画像出典：Artificial Analysis「Independent analysis of AI models and API providers」

上記のグラフは、APIに送信されるリクエストとメッセージに含まれるトークンあたりの料金（入力料金＝青）と、各生成AIモデルによって生成された（APIから受信した）トークンあたりの料金（100万トークンあたりのUSD＝出力料金＝紫）を示しています。

GPT-4o miniは入力料金0.15アメリカンドル、出力料金0.6アメリカドルとGemini1.5 Frashに次ぐ低料金であるのがわかります。

料金が安いことで、試しに生成AIを活用してみたい、少しだけ使ってみたいといったライトユーザー層が持つニーズにも対応可能です。

出力速度

画像出典：Artificial Analysis「Independent analysis of AI models and API providers」

上記のグラフは、各生成AIモデルがトークンを生成している間に受信した1秒あたりのトークン数を示しています。GPT-4o miniの出力速度は、Gemini1.5 FlashやLlama3.1 8Bに次ぐ5位で113トークン／毎秒となっており、生成AIモデルの中でも速い方です。

GPT-4o miniは、AI使用にあまり多くの時間を割けない人にも使いやすい生成AIモデルだと言えます。

入力トークン数による出力速度

画像出典：Artificial Analysis「Independent analysis of AI models and API providers」

上記のグラフは、各生成AIモデルに100トークン（青）・1,000トークン（紫）・10,000トークン（緑）を入力したトークン数による出力速度の違いを表しています。

GPT-4o miniは、生成AIモデルの中では5位ですが、入力したトークン数による出力速度の違いが10前後とあまり大きくないのが特徴的だと言えます。

GPT-4o miniの性能

画像出典：OpenAI「GPT-4o mini：コスト効率の高いインテリジェンスを進化させる」

OpenAIは2024年7月18日、軽量モデル「GPT-4o mini」を発表し、主要な生成AI5モデル（GPT-4o mini、GPT-4o、GPT-3.5 Turbo、Gemini Flash、Claude Haiku）を対象に、8種類のEval Benchmarkで性能比較を行いました。

主な評価指標とGPT-4o miniの結果は以下の通りです。

言語理解を測るMMLUでは、GPT-4oに次ぐ82.0％を記録。Gemini FlashやClaude Haikuよりも高精度。
大学院レベルの専門知識を問うGPQAでは、GPT-4oに次ぐ成績で、幅広い質問に対応可能。
推論力を試すDROPでは、79.7％と他モデルと比べても遜色ない高水準。
テキストや画像の統合処理を測るMGSMでは、87.0％とGPT-4oに次ぐ順位でマルチモーダル性能を発揮。
数学力を評価するMATHでは70.2％を記録し、他の軽量モデルを大きく引き離す。
プログラム生成能力を評価するHumanEvalでも87.2％と高く、GPT-4oとの差もわずか。
数学的なマルチモーダル理解を問うMMMUやMathVistaでも、GPT-4oに次ぐ安定した結果を残している。

GPT-4o miniは、処理能力や応答品質を維持しつつ、コストを抑えた点が特に魅力です。言語理解・数学・プログラミング分野で特に優れたパフォーマンスを発揮しており、今後の進化も期待されます。

GPT-4o miniの使い方

ここからは、GPT-4o miniの使い方として、以下の4つをご紹介します。

ChatGPT
Assistants API
Chat Completions API
Batch API

ChatGPTでの使い方

GPT-4o miniはChatGPTに搭載されているため、会話の最後に表示される星マークのプルダウンから選んで使うことができます。無料プランの場合は、GPT-4oに5時間に約10回の回数制限に達すると、自動的にGPT-4o miniに移行する仕組みです。

今までご紹介したGPT-4oとの違いを踏まえ、使い分けてみるのがおすすめです。

Assistants APIでの使い方

Assistants APIはChatGPTでの機能の1つです。自分だけのAIアシスタントを作れますが、アシスタントを作成する際に使用するChatGPTのベースモデルにGPT-4o miniも設定できるようになっています。

具体的には、Assistants APIのアシスタントについて、「Name（名前）」「Instructions（役割）」「Models（使用するChatGPTのモデル）」「Tools（連携するAPI）」の4項目を設定することとなっています。

自分のアシスタントへのニーズにGPT-4o miniが合っているかを確かめるためにも、設定を変えて一度使ってみるのがおすすめです。

Chat Completions APIでの使い方

Chat Completions APIはOpenAIのAPIの一部で、チャット形式の対話を生成できるためカスタマーサポート・チャットボット・対話型アプリケーションなどに利用されています。また、Chat Completions APIでは、文章生成に使うAIモデルにGPT-4o miniが設定できます。

Chat Completions APIを使った独自のチャットサービスなどを提供している場合、MMLUで文脈の理解や質疑応答に優れていると評価されたGPT-4o miniも試してみてください。