生成AI

最終更新日:2025/02/26
アメリカのAI企業xAIは、最新の生成AIモデル「Grok 3」を2025年2月19日(日本時間)にリリースしました。イーロン・マスク氏が公開前に「世界で最も賢い」とX(旧Twitter)で投稿したこともあり、世界中から注目を集めています。
リリース:xAI、新たな推論モデル「Grok-3」を発表。探索機能「DeepSearch」も登場
Grok 3は、xAIが開発した最新の生成AIモデルで、XやWeb版Grokで提供されています。
数学や科学、コーディングといったベンチマークにおいて、OpenAIの「GPT-4o」やGoogleの「Gemini 2 Pro」、Anthropicの「Claude 3.5 Sonnet」、DeepSeekの「DeepSeek V3」など主要な大規模言語モデル(LLM)を上回る性能を示しています。
また、推論モデルの「Grok 3 Reasoning」「Grok 3 mini Reasoning」や小規模モデル「Grok 3 mini」も同時に公開されました。利用には、Xの有料プラン「X Premium+」のユーザーに加え、Grokの機能を独立して提供する「SuperGrok」の登録が必要ですが、現時点では無料で利用可能です。
xAIによれば、Grok 3は前作の「Grok 2」と比較して、10倍以上の演算能力で事前学習されています。
学習には、NVIDIAのGPU「H100」が10万枚搭載されたスーパーコンピュータ「Colossus(コロッサス)」が使用され、合計で約2億GPU時間ものトレーニングを効率的に行うことが可能となりました。
これにより、大規模データセットの処理効率が向上し、Grok 3の学習時間の短縮と精度向上が実現しています。一般的な大規模AIモデルの開発には数年かかるところ、Grok 3では約1年まで短縮されています。
Grok 3には以下の特徴があります。
DeepSearch機能は、インターネットとXの投稿を横断的に検索し、要点をまとめて出力するリアルタイム検索機能です。
Grok 3ではこの機能が標準搭載されており、最新のデータを適切に反映した回答を提供します。ChatGPTのリサーチ機能「Deep Research」と類似していますが、Grok 3はX上のデータも網羅している点が特徴です。
「Grok 3 Reasoning」や「Grok 3 mini Reasoning」といった推論モデルでは、大規模な強化学習(RL)を実施し、チェイン・オブ・ソート(CoT)を活用したデータ効率の高い推論を実現しています。
これにより、複雑な質問に対しても試行錯誤を繰り返し、最適な回答を導き出します。また、「Think」モードや「Big Brain」モードを搭載しており、複雑な問題への対応力が高い点も特徴です。
Grok 3の性能向上のため、人工的に生成された合成データセットを用いて多様なシナリオでトレーニングを行っています。
これにより、学習効率の向上とデータプライバシーの問題への対策が期待できます。さらに、モデル自身が誤りを検出し修正する自己修正メカニズムや、人間によるフィードバックを採用し、回答の精度向上とハルシネーションの削減に寄与しています。
各種ベンチマークによると、Grok 3は従来モデルや他社のモデルを大きく上回るパフォーマンスを示しています。
LLMの性能を比較する評価プラットフォーム「Chatbot Arena(LMSYS)」では、Early Grok 3が最上位付近に位置し、GPT-4oやGemini-2 Pro、DeepSeek-R1などを上回っています。
また、数学や科学、コーディングのベンチマークでも、GPT-4oやDeepSeek-V3、Gemini 2 Proを抑えて、Grok 3が最高スコアを記録しています。
ベンチマーク | Grok 3 | ChatGPT(GPT-4o) | DeepSeek-V3 | Gemini 2 Pro |
---|---|---|---|---|
数学(AIME’24) | 52 | 9 | 39 | 36 |
科学(GPQA) | 75 | 50 | 59 | 65 |
コーディング(LCB Oct-Feb) | 57 | 34 | 40 | 36 |
Grok 3を利用するには、Xの有料プラン「X Premium+」またはGrok専用の「SuperGrok」プランへの登録が必要です。各プランの料金と主な機能は以下の通りです。
料金プラン | 料金 | 主な機能 |
X Basic | 月額368円/年額3,916円 | ・プレミアムの基本的な機能が利用可能 ・広告表示あり ・Grok利用不可 |
X Premium | 月額980円/年額10,280円 | ・広告の非表示 ・一部の追加機能が利用可能 ・Grok利用不可 |
X Premium+ | 月額6,080円/年額60,036円* | ・Grok-3の利用:DeepSearch機能や推論機能へのアクセス ・投稿や会話の利用制限の緩和 ・広告表示の半減 ・クリエイター収益分配 |
SuperGrok | 月額30ドル/年額300ドル | ・Grok-3優先アクセス:DeepSearch機能や推論機能 ・画像生成数の上限アップ ・Grok専用アプリ(iOS) |
*2025年2月19日(日本時間)より適用
ここからは、Grok 3 の主な活用事例を紹介します。
Grok 3 の優れた推論能力を活用することで、複雑なタスクや問題に対して効率的に対応できます。
例えば、物理の法則や計算式が必要な問題について、Grok 3に入力すると、複雑な計算を段階に分解して実行し、最終的な回答を生成します。
また、プログラミングコードや図解の生成を同時に依頼することも可能で、専門知識がない人でも理解しやすい形でデータを出力可能です。
Grok 3 では、DeepSearch 機能により、ユーザーの意図をより深く理解した上で、文脈に基づいた情報を提供します。
質問を入力すると、X上と Web の情報を調査し、関連情報を分析し、自然言語処理技術を駆使して回答を生成できます。
また、専門家に依頼するような高度な内容でも、適切なレポートを出力可能です。
Grok 3 で、「今月東京で開催される予定のイベントで、子連れにおすすめのものは?」と入力すれば、イベントの情報を調べて比較検討し、ニーズに合ったものを提示してくれます。
また、イベントがXでどの程度話題になっているか知りたい場合にも、X上の投稿を瞬時にリサーチし、投稿内容のまとめを作成します。
Grok 3 は、コード生成やデバッグの効率化などのプログラミング業務にも活用できます。自然言語で Grok 3 に指示することで、要件に基づいたコードを自動的に生成可能です。例えば、ゲームやシミュレーション用アニメーションのコードを生成したい場合、テキスト指示により数十秒ほどでコードを出力します。
Grok 3 では、X上の情報を優先する傾向があると報告されています。
X上でのデータやユーザーの情報を集めたい場合は便利ですが、広範囲の情報を得るには、プロンプトで他の情報源を参照するよう指示する必要があります。
また、必要に応じてインターネット検索を併用するのが望ましいです。加えて、Grok 3 の回答を鵜呑みにせず、内容を確認した上で利用することも重要です。
AIが完璧にタスクを実行できるとは言い切れないため、最終的な判断はユーザーが行うことを徹底しましょう。
xAIは、今後 Grok 3 をさらにアップデートし、周辺機能の強化が予定されています。 また、イーロン・マスク氏は「政治的に中立なAI」を実現することを強調しており、これまでに問題視された Grok での政治的バイアスへの対策が講じられる予定です。
さらに、DeepSearch 機能の高度化によって、リアルタイム情報への対応精度の向上と、ユーザー分析作業の効率化を実現するとしています。
Grok 3 は、前モデルの Grok 2 から推論性能や思考プロセスを中心に強化されました。イーロン・マスク氏が「地球上で最も賢いモデル」と謳うように、各種ベンチマークにおいてChatGPT の GPT-4oをも超える評価を打ち出しています。
DeepSearch 機能や Think モードを利用することで、より高度な質問や複雑なタスクに対応できる仕様です。現時点では無料公開されているので、高性能AIモデルを体験してみましょう。
アイスマイリーでは、生成AIサービスの提供企業一覧を無料配布しています。自社におけるAI導入を円滑に進めるために必要な詳細情報をわかりやすくまとめています。この機会に一括資料請求をご利用ください。
Grok 3 は、2025年2月19日(日本時間)から提供が開始されています。当初は、Xの有料プラン「X Premium+」または、Grok の「SuperGrok」の契約者のみに提供される予定でしたが、現時点では無料公開されており、多くの機能を体験できます。
Grok 3 は、数学や科学、コーディングなど複数のベンチマークでChatGPT(GPT-4o)を超えるスコアを出しています。また、ChatGPT では難しいXの情報を含めたリサーチは、Grok 3 が得意とするところであり、リアルタイムなユーザーの反応を収集、分析したい場合に Grok 3 が有用です。
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら