OpenAI新たなAIモデル「o1」とは?使い方や料金、ChatGPT-4oとの違いを詳しく解説
最終更新日:2024/12/03
OpenAIは、最新のAIモデル「o1」を2024年9月12日に発表しました。新モデル「o1」は、複雑な学術タスクや推論において非常に高いパフォーマンスを発揮しています。
OpenAIの新モデル「o1」とは
このモデルの特徴をOpenAIが以下のように発表しております。
- 物理学、化学、生物学の難しいタスクで博士課程の学生と同等のパフォーマンスを発揮
- 数学とコーディング能力でも優れている
- 国際数学オリンピック予選試験で83%のスコアを獲得(以前は13%)
- コーディングコンテスト「Codeforces」で上位11%(89パーセンタイル)に到達
- 初期モデルであり、Web閲覧やファイル・画像のアップロードなどの機能はまだ未対応
- 複雑な推論タスクでの大きな進歩を示しており、AIの新たなレベルを象徴
出典:OpenAI
物理学、化学、生物学の分野でパフォーマンスを発揮
物理学、生物学、化学の問題のベンチマーク (GPQA=Graduate-level Physical and Quantitative Assessment)ダイアモンドレベルの問題集で、人間の博士レベルの精度を超えました。
各分野の精度をgpt4oとo1で比較
3分野全てo1の方が良い結果を記録しており、中でも化学・物理学に関してはgpt4oの性能を大きく上回った結果になった。
数学分野の能力について
AIME試験※で数学のパフォーマンスを評価した結果、GPT-4oは平均で12%(1.8/15)の問題しか解きませんでした。
o1は、問題ごとに1つのサンプルで平均74%(11.1/15)、64のサンプル間のコンセンサスで83%(12.5/15)、学習したスコアリング関数で1000のサンプルを再ランク付けすると93%(13.9/15)でした。
13.9というスコアは、全国のトップ500人であるとともに数学オリンピックの候補者の能力を超えていました。
※AIME試験=アメリカの最も優秀な高校生の数学に挑戦するように設計された試験
GPT-4o、o1-preview、o1-ioiという3つのモデルでの比較
データセット | gpt-4o | o1-preview | o1-ioi |
競争数学AIME(2024) | 13.4 | 56.7 | 83.3 |
※o1-ioi=国際情報学オリンピック(IOI)用に調整されたo1モデル
「o1」は、まだ初期段階のモデルながらも、学術分野での難解な課題やコーディング分野において優れた成果を上げており、今後の機能強化によって、さらに多くの実用的なシーンでの活躍が期待されています。
OpenAI o1 シリーズのモデル比較:o1-previewとo1-mini
OpenAIが提供するo1シリーズには、複雑な推論を得意とする「o1-preview」と、その軽量版である「o1-mini」の2つのモデルがあります。それぞれの特徴と用途をわかりやすく解説します。
o1-previewの特徴と用途
o1-previewは、高度な推論能力を持つモデルで、世界中の幅広い知識を活用しながら、複雑な問題を解決する力を発揮します。たとえば、物理や化学、生物学といった科学分野で人間の博士レベルを超える精度を誇り、競技プログラミング問題や数学オリンピックの問題でも高い成果を挙げています。
このモデルの最大の強みは、内部で「考える」プロセスを持つ点です。複数の解法を検討しながら最適な回答を導き出すため、科学研究や高度なアルゴリズム設計、データ解析といった場面で力を発揮します。
ただし、応答に数秒〜数分かかる場合があるため、リアルタイム性を重視する用途には向きません。また、高度なタスク向けであるため、簡単な問題には性能が過剰になることもあります。
o1-miniの特徴と用途
一方のo1-miniは、o1-previewの軽量版です。処理速度が速く、コスト効率にも優れており、シンプルなタスクを迅速に処理できます。コーディング支援やデバッグ、カスタマーサポートのチャットボットなど、リアルタイム性が求められる場面で活躍します。
ただし、深い推論を必要とする高度な問題には不向きで、応答の精度が低下する場合があります。そのため、簡単なプログラミングや日常的なタスク向けとして利用するのが最適です。
o1の使い方・料金について
o1には2つのモデルがあり、上記の機能を備えたものが「o1-preview」、それより高速で80%安価な「o1-mini」があります。
o1-preview使い方
o1-previewはChatGPT Plusとteamユーザーは12日から順次利用可能になると発表されています。無料のEnterpriseもしくはEduユーザーは来週(9/16?17?)から利用可能になる様です。
ChatGPT Plusでは既に利用可能でした。(2024/9/13現在)
o1-previewの料金
追加料金は必要なくChatGPTのプランが適応されています。
ChatGPTのUIからの利用は1週間に30メッセージとされています。
※o1-miniでは1週間50メッセージ
現時点ではChatGPTのUIだと各モデルを選択する必要がありますが、将来的には特定のプロンプトに対して適切なモデルを自動選択できるとのことです。
o1-previewのAPIについて
現時点で組織のレート制限がティア5の資格であればレート制限が 20 RPM の状態で、API で両方のモデルのプロトタイプを今すぐ開始できます。
(参考:ティア別レート表)
ティアはOpenAI APIの使用量と API への支出が増えると、自動的に次の使用レベルに移行します。
ティア5の利用料金は以下の通りとなっています。
Model | RPM | TPM | Batch Queue Limit |
---|---|---|---|
o1-preview | 20 | 30,000,000 | not currently supported |
o1-mini | 20 | 150,000,000 | not currently supported |
gpt-4o | 10,000 | 30,000,000 | 5,000,000,000 |
gpt-4o-mini | 30,000 | 150,000,000 | 15,000,000,000 |
※o1-preview・o1-miniの API には現在、関数呼び出し、ストリーミング、システム メッセージのサポート、その他の機能は含まれていません。
OpenAIは追加のテストの後、これらの制限を増やす予定と発表しています。
OpenAI o1モデルのプロンプト作成のポイント
OpenAI o1モデルを使う際は、プロンプト(指示文)を簡潔でわかりやすく設計することで、最良のパフォーマンスを発揮できます。以下が、プロンプト作成時のポイントです。
プロンプトはシンプルかつ明確に
モデルは、細かい指示がなくても、簡潔で直接的な指示を的確に理解して応答します。不要な説明や複雑な文は避ける必要があります。
「思考のプロセス」を求めない
モデルは、内部で推論を実行する仕組みを持っているため、「段階ごとに考える」や「推論を説明する」ような指示は不要です。これらの指示はむしろ、応答の精度を下げる可能性があります。
区切り文字を使って入力を整理する
プロンプトの異なる部分を明確にするために、三重引用符(”””)・XMLタグ・セクションタイトルなどを活用してください。これにより、モデルが入力を正確に解釈しやすくなります。
検索拡張生成(RAG)でのコンテキストを必要最小限にする
モデルに追加の情報や文書を与える際は、関連性の高い情報だけを含めるようにします。不必要な情報を追加すると、モデルの応答が複雑になり、正確性が損なわれる可能性があります。
まとめ
新AIモデル「o1」は、現時点で既に学術やコーディングタスクで顕著な性能を示し、博士課程の学生レベルの能力を発揮しています。
OpenAIのo1以外にも生成AI関連の製品リリースは多く、今後も技術発展が期待できる分野となっています。
アイスマイリーでは生成AI関連の製品を数多く取り扱っており、製品別に比較検討する資料を無料提供しています。 この機会に、ぜひご活用ください。
また生成AIを使った製品同士も、こちらのページで比較検討することができます。
AIについてさらに詳しく知りたい方はこちらの記事もご覧ください。
AI・人工知能とは?定義・歴史・種類・仕組みから事例まで徹底解説
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI・人工知能記事カテゴリ一覧
AI・人工知能サービス
- 生成AI
- 画像生成AI
- ChatGPT
- AI研究開発
- LLM
- DX推進
- おすすめAI企業
- チャットボット
- ボイスボット
- 音声認識・翻訳・通訳
- 画像認識・画像解析
- 顔認証
- AI-OCR
- 外観検査
- 異常検知・予知保全
- 自然言語処理-NLP-
- 検索システム
- 感情認識・感情解析
- AIモデル作成
- 需要予測・ダイナミックプライシング
- AI人材育成・教育
- アノテーション
- AI学習データ作成
- エッジAI
- IoT
- JDLA
- G検定
- E資格
- PoC検証
- RPAツール
- Salesforce Einstein
- Watson(ワトソン)
- Web接客ツール
- サプライチェーン
- メタバース
- AR・VR・デジタルツイン
- MI
- スマートファクトリー
- データ活用・分析
- 機械学習
- ディープラーニング
- 強化学習
- テレワーク・リモートワーク
- マーケテイングオートメーション・MAツール
- マッチング
- レコメンド
- ロボット
- 予測
- 広告・クリエイティブ
- 営業支援・インサイドセールス
- 省人化
- 議事録自動作成
- 配送ルート最適化
- 非接触AI
業態業種別AI導入活用事例
今注目のカテゴリー
AI製品・ソリューションの掲載を
希望される企業様はこちら