OpenAI、言語モデルがハルシネーションを起こす理由について論文を公開

最終更新日:2025/09/09

ハルシネーションを起こす理由

OpenAIは、言語モデルがハルシネーションを起こす理由について論文を公開しました。

このニュースのポイント

OpenAIは、言語モデルがハルシネーションを起こす理由について論文を公開
ハルシネーションは現在の評価方法が間違っているため無くならない
言語モデルによって出力される確信度の高いエラー率を下げるために、引き続き努力する

米OpenAI社は、言語モデルがハルシネーションを起こす理由について論文を公開しました。

ハルシネーションとは、言語モデルによって生成されるもっともらしいが間違った記述のことです。例として誕生日を訪ねたりすると、本来の誕生日とは異なる日付を回答することがあります。

こうした現象はChatGPTでも発生します。最新のモデルでは推論時のハルシネーションは大幅に減りましたが、それでも完全にはなくなっていません。ハルシネーションは、あらゆる大規模言語モデルに共通する根本的な課題です。

ハルシネーションがなくならない理由として、現在の評価方法が間違っていることが挙げられます。選択式テストでは空欄にするより適当に答えた方が有利になる場合があり、多くのベンチマークでは「わからない」と回答するよりも「推測する」ことが有利になります。

Metric	gpt-5-thinking-mini	OpenAI o4-mini
Abstention rate (no specific answer is given)	52%	1%
Accuracy rate (right answer, higher is better)	22%	24%
Error rate (wrong answer, lower is better)	26%	75%
Total	100%	100%

具体例としてsimpleQAベンチマークでは正答率だけを見ればo4-miniの方がわずかに優秀ですが、誤答率はgpt-5-thinking-miniよりはるかに高くなっています。これは不確実な時に推測することで正答率を上げる一方、誤答やハルシネーションの発生率を高めます。

解決策として「誤答」には「不確実」と答えるよりも大きなペナルティを与え、不確実性を適切に表現した回答には部分点を与えることで解決します。

そもそもどうして特定の事実に関して「もっともらしい誤答」が出てくるのかですが、一貫したパターンがあるスペルや括弧のミスに関しては規模が大きくなればなくなります。しかし「誕生日」などの低頻度でランダムな事実は予想不可能であり、ハルシネーションにつながります。

OpenAIは、最新モデルではハルシネーション率は低くなっており、言語モデルによって出力される確信度の高いエラー率を下げるために、引き続き努力をしていくとしています。

出典：OpenAI

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています @AIsmiley.inc
・Xもフォローください @AIsmiley_inc
・Youtubeのチャンネル登録もお願いいたします@aismiley
メルマガに登録する

AIサービス: AI研究開発; LLM; おすすめAI企業

DXトレンドマガジンメールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

お名前 - 名

名を入力してください

メールアドレス

メールアドレスを入力してください

AI・人工知能記事カテゴリ一覧

AI・人工知能サービス

特集

今注目のカテゴリー

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

DXトピックス

AIsmileyからご案内

SNSをフォローして、最新情報をチェックできます！

DXトレンドマガジンメールマガジン登録

メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

お名前 - 名

お名前 - 名を入力してください

メールアドレス

メールアドレスを入力してください

ニュースPVランキング

週間PVランキング

AI活用を無料で相談する

AI製品・ソリューションの掲載を
希望される企業様はこちら

詳細はこちら

OpenAI、言語モデルがハルシネーションを起こす理由について論文を公開

生成AIを資料請求

AI・人工知能記事カテゴリ一覧

AI・人工知能サービス

業態業種別AI導入活用事例

特集

今注目のカテゴリー

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AIを
資料請求

ニュースPVランキング

OpenAI、ChatGPT、APIおよび Codex で「GP…

住信SBIネット銀行、国内銀行初アプリ上で画面を自動生成する「N…

OpenAI、「ChatGPT for Excel」ベータ版をリ…

NRI、Anthropic Japanとのパートナーシップを拡大…

OpenAI、言語モデルがハルシネーションを起こす理由について論文を公開

生成AIを資料請求

AI・人工知能記事カテゴリ一覧

AI・人工知能サービス

業態業種別AI導入活用事例

特集

今注目のカテゴリー

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AIを資料請求

ニュースPVランキング

OpenAI、ChatGPT、APIおよび Codex で「GP…

住信SBIネット銀行、国内銀行初アプリ上で画面を自動生成する「N…

OpenAI、「ChatGPT for Excel」ベータ版をリ…

NRI、Anthropic Japanとのパートナーシップを拡大…

関連記事

デジタル庁、全府省庁の約18万人の政府職員を対象としたガバメントAI「源内」の大規模実証を開始

【初公開】AIエージェント導入の適否判断ガイド｜あなたの業務にAIエージェントは本当に必要なのか？

Microsoft、「Copilot Cowork」の限定版を提供開始。会議の再スケジュールや業務タスクの実行を自動化

アイスマイリー、3/24（火）から3日間「AI World 2026 春 福岡」に出展 ブース予約でAmazonギフト1,500円分プレゼント！

KLab、自社AIアイドル「ゆめみなな」のデビュー配信を実施。完全AIによる初配信を発表

4/8（水）から3日間「Japan DX Week【春】2026 / AI・業務自動化 展」にブース出展

生成AIを
資料請求

アイスマイリー、3/24（火）から3日間「AI World 2026 春福岡」に出展　ブース予約でAmazonギフト1,500円分プレゼント！

4/8（水）から3日間「Japan DX Week【春】2026 / AI・業務自動化展」にブース出展