OpenAIが新モデル「GPT-4」を発表!ChatGPTの有料版にも搭載、司法試験では上位10%のスコアを記録
最終更新日:2024/02/07
OpenAIは、大規模マルチモーダルAI「GPT-4」を新たに発表しました。
このAIニュースのポイント
- 学術的なベンチマークにおいて人間と同等のスコアを記録
- 26言語中24言語で、GPT-4はGPT-3.5のパフォーマンスを越える
- 機密性の高いリクエストに応答する頻度が29%向上
OpenAIは、ディープラーニングのスケーリングアップの取り組みの中で、最新の大規模マルチモーダルである「GPT-4」を発表しました。
GPT-4は、多くの現実世界のシナリオでは人間よりも処理能力が劣りますが、プロフェッショナルや学術的なベンチマークにおいては、人間レベルのパフォーマンスを発揮します。例えば、司法試験を受験させた場合、上位10%程度のスコアを記録しています。一方で、GPT-3.5のスコアは下位10%程度でした。
敵対的学習とChatGPTからの教訓を反復的に取り入れ、GPT-4を学習させるために6ヶ月間を費やした結果、誤分類が大幅に減少しました。
カジュアルな会話では、GPT-3.5とGPT-4の違いは微妙です。しかし、タスクの複雑さが十分な閾値に達すると、GPT-4はGPT-3.5よりも信頼性が高く、創造性があり、より微妙な指示を扱うことが可能になります。
既存の多くのベンチマークは英語で記述されています。他の言語における能力の初期段階の把握のために、57の科目にまたがる14,000の多肢選択問題のスイートであるMMLUベンチマークを、Azure Translateを使用してさまざまな言語に翻訳しました。26言語中24言語で、GPT-4はGPT-3.5のパフォーマンスを上回っていました。
GPT-4は、テキストだけでなくテキストと画像のプロンプトを受け取ることが可能です。テキストのみの設定と並行して、ユーザーは任意の視角または言語タスクを指定できます。テキストと写真、図表、スクリーンショットを含むさまざまなドメインにおいて、テキストのみの入力と同様の能力を発揮します。
依然としてGPT-4は、事実を誤認したり、推論エラーを起こすことがあるので、完全に信頼できるサービスではありません。特にリスクの高い文脈で使用する際に細心の注意が必要です。しかしながら、内部の敵対的事実性評価よって、GPT-3.5よりも40%高いスコアを獲得しています。
また、GPT-4は、エラーを犯す可能性がある際に、再確認を怠ることがあります。興味深いことに事前に学習済のデータは、高精度に調節されています。
GPT-4は、GPT-3.5と比較し、モデルが許可していないコンテンツのリクエストに応答する傾向が82%減少しました。また、ポリシーに従って機密性の高いリクエストに応答する頻度が29%向上しました。
AIシステムの「トークンあたりのリスク」が増加するにつれて、これらの介入で非常に高い信頼性を達成することが重要になります。現時点では、不正使用の監視などの展開時の安全技術でこれらの制限を補完することが重視されます。
OpenAIは、より良いガイダンスを社会に提供する方法を開発する取り組みを拡大しており、これがこの分野の共通の目標になることを願っています。
出展:OpenAI
- AIサービス
- 生成AI
- 自然言語処理-NLP-
- ディープラーニング
- 強化学習
- 導入活用事例
- IT・情報・通信
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI・人工知能記事カテゴリ一覧
AI・人工知能サービス
- 生成AI
- 画像生成AI
- ChatGPT
- AI研究開発
- LLM
- DX推進
- おすすめAI企業
- チャットボット
- ボイスボット
- 音声認識・翻訳・通訳
- 画像認識・画像解析
- 顔認証
- AI-OCR
- 外観検査
- 異常検知・予知保全
- 自然言語処理-NLP-
- 検索システム
- 感情認識・感情解析
- AIモデル作成
- 需要予測・ダイナミックプライシング
- AI人材育成・教育
- アノテーション
- AI学習データ作成
- エッジAI
- IoT
- JDLA
- G検定
- E資格
- PoC検証
- RPAツール
- Salesforce Einstein
- Watson(ワトソン)
- Web接客ツール
- サプライチェーン
- メタバース
- AR・VR・デジタルツイン
- MI
- スマートファクトリー
- データ活用・分析
- 機械学習
- ディープラーニング
- 強化学習
- テレワーク・リモートワーク
- マーケテイングオートメーション・MAツール
- マッチング
- レコメンド
- ロボット
- 予測
- 広告・クリエイティブ
- 営業支援・インサイドセールス
- 省人化
- 議事録自動作成
- 配送ルート最適化
- 非接触AI
業態業種別AI導入活用事例
今注目のカテゴリー
AI製品・ソリューションの掲載を
希望される企業様はこちら