生成AI

AIエージェント
生成AI
ChatGPT連携サービス
AI受託開発
対話型AI -Conversational AI-
ボイスボット
バーチャルヒューマン
教師データ作成
AI研究開発
通訳・翻訳
声紋認証
機密情報共有・管理
契約書管理システム
ワークステーション
FAQシステム
AIカメラ
生体認証
インボイス制度対応システム
データセットの収集・購入
コールセンター
人事・総務向け
インバウンド対策
コンバージョンアップ
KYT・危険予知で労働災害防止
無料AI活用
顧客リスト自動生成
ロボットで自動化
LINE連携
セキュリティー強化
テレワーク導入
AI学習データ作成
配送ルート最適化
非接触AI
受付をAIで自動化、効率化
AIリテラシーの向上サービス
日本語の手書き文字対応AI-OCR
Windows作業の自動化RPAツール
リスク分析AIで与信管理
紙帳票仕分けAI-OCRサービス
サプライチェーン
AIコンサルティング
最終更新日:2024/07/18
GPT-4の誤りを指摘するモデルが登場
OpenAIは、ChatGPTのコード出力のエラーを検出するためのGPT-4ベースのモデル「CriticGPT」を発表しました。
このニュースのポイント
米OpenAIは、ChatGPTが出力したコードの誤りを検出するモデル「CriticGPT」を発表しました。GPT-4をベースとして作られており、人間によるAIトレーニングの精度向上を支援します。
ChatGPTを動かすGPT-4シリーズのモデルは、その有用性を保つため、人間からのフィードバックによる強化学習 「RLHF」と呼ばれる手法によって調整・構築されています。AIのトレーニングを担う人々がChatGPTのさまざまな応答を評価し、その比較結果を収集します。
しかし、必然的に推論性能やモデルが進化することによって、AIトレーナーは不正確な回答を発見することが難しくなり、この事態はRLHFの限界とされています。
「CriticGPT」はこの問題に対処するため、誤った情報も含めた大量の情報によってトレーニングされており、このモデルも同様にRLHFによって調整されています。

「CriticGPT」は、ChatGPTと同様にRLHFでトレーニングされていますが、ChatGPTとは異なり、誤りを含む大量の入力を学習データとして使用し、それらを批評するようにトレーニングされています。
AIトレーナーに、誤りの情報をChatGPTによって記述されたコードに手動で挿入させ、その誤りを発見した場合にどのようなフィードバックを行うかを記述した例を作成します。次に、同じトレーナーが修正されたコードに対する複数の批評文を比較し、どの批評文が挿入された誤りを正しく指摘しているかを評価します。
実験では、CriticGPTが挿入された誤りと、トレーナーが見つけた「自然発生的な」ChatGPTの誤りの両方を検出できるかどうかを調べたところ、「自然発生的な」ChatGPTの批評よりも、CriticGPTの批評が有用性が高いことがわかりました。

さらにCriticGPTの支援を受けてコードレビューを行った場合、支援なしの場合と比較して、約60%の確率でパフォーマンスが向上したことがわかりました。
また、AIトレーナーはCriticGPTを用いることで、より包括的な批評文を作成することができ、モデル単独で批評文を作成する場合よりも誤った指摘を減らすことができます。
OpenAIは、より長文で複雑なタスクを批評できるようにするため、CriticGPTのさらなる改良を進める予定です。
出典:OpenAI
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら