DXを推進するAIポータルメディア「AIsmiley」| AI製品・サービスの比較・検索サイト
03-6452-4750 10:00〜18:00 年末年始除く
よく検索されているキーワード

OpenAIが新モデル「GPT-4」を発表!ChatGPTの有料版にも搭載、司法試験では上位10%のスコアを記録

最終更新日:2024/02/07

OpenAIは、大規模マルチモーダルAI「GPT-4」を新たに発表しました。

このAIニュースのポイント

  • 学術的なベンチマークにおいて人間と同等のスコアを記録
  • 26言語中24言語で、GPT-4はGPT-3.5のパフォーマンスを越える
  • 機密性の高いリクエストに応答する頻度が29%向上

OpenAIは、ディープラーニングのスケーリングアップの取り組みの中で、最新の大規模マルチモーダルである「GPT-4」を発表しました。

GPT-4は、多くの現実世界のシナリオでは人間よりも処理能力が劣りますが、プロフェッショナルや学術的なベンチマークにおいては、人間レベルのパフォーマンスを発揮します。例えば、司法試験を受験させた場合、上位10%程度のスコアを記録しています。一方で、GPT-3.5のスコアは下位10%程度でした。

敵対的学習とChatGPTからの教訓を反復的に取り入れ、GPT-4を学習させるために6ヶ月間を費やした結果、誤分類が大幅に減少しました。

カジュアルな会話では、GPT-3.5とGPT-4の違いは微妙です。しかし、タスクの複雑さが十分な閾値に達すると、GPT-4はGPT-3.5よりも信頼性が高く、創造性があり、より微妙な指示を扱うことが可能になります。

既存の多くのベンチマークは英語で記述されています。他の言語における能力の初期段階の把握のために、57の科目にまたがる14,000の多肢選択問題のスイートであるMMLUベンチマークを、Azure Translateを使用してさまざまな言語に翻訳しました。26言語中24言語で、GPT-4はGPT-3.5のパフォーマンスを上回っていました。

GPT-4は、テキストだけでなくテキストと画像のプロンプトを受け取ることが可能です。テキストのみの設定と並行して、ユーザーは任意の視角または言語タスクを指定できます。テキストと写真、図表、スクリーンショットを含むさまざまなドメインにおいて、テキストのみの入力と同様の能力を発揮します。

依然としてGPT-4は、事実を誤認したり、推論エラーを起こすことがあるので、完全に信頼できるサービスではありません。特にリスクの高い文脈で使用する際に細心の注意が必要です。しかしながら、内部の敵対的事実性評価よって、GPT-3.5よりも40%高いスコアを獲得しています。

また、GPT-4は、エラーを犯す可能性がある際に、再確認を怠ることがあります。興味深いことに事前に学習済のデータは、高精度に調節されています。

GPT-4は、GPT-3.5と比較し、モデルが許可していないコンテンツのリクエストに応答する傾向が82%減少しました。また、ポリシーに従って機密性の高いリクエストに応答する頻度が29%向上しました。

AIシステムの「トークンあたりのリスク」が増加するにつれて、これらの介入で非常に高い信頼性を達成することが重要になります。現時点では、不正使用の監視などの展開時の安全技術でこれらの制限を補完することが重視されます。

OpenAIは、より良いガイダンスを社会に提供する方法を開発する取り組みを拡大しており、これがこの分野の共通の目標になることを願っています。

出展:OpenAI

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています
@AIsmiley.inc
・Xもフォローください
@AIsmiley_inc

DXトレンドマガジン メールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓

姓を入力してください

お名前 - 名

名を入力してください

メールアドレス

メールアドレスを入力してください

AI・人工知能記事カテゴリ一覧

今注目のカテゴリー

ChatGPT連携サービス

チャットボット

画像認識・画像解析

需要予測

ChatGPT連携サービス

チャットボット

画像認識・画像解析

需要予測

AI活用のご相談したい企業様はこちら

03-6452-4750

AI製品・ソリューションの掲載を
希望される企業様はこちら