生成AI

最終更新日:2026/02/09
Claude Opus 4.6 リリース
Anthropicは、コーディング能力やエージェント機能を大幅に強化した新モデル「Claude Opus 4.6」をリリースしました。
このニュースのポイント
米Anthropicは、コーディング能力やエージェント機能を大幅に強化した新モデル「Claude Opus 4.6」をリリースしました。「Claude Opus 4.6」は、前モデルからコーディングスキルの向上や、複雑なタスクの計画能力、エージェントタスク実行継続時間の延長、大規模コードベースでの信頼性の高い動作などが改善されました。
コードレビューとデバッグ機能も向上しており、AI自体がミスした際にも発見しやすくなっています。また、Opusクラスのモデルとして初めて100万トークンのコンテキストウィンドウ(β版)が搭載されています。
また、文脈上の手がかりから拡張思考(extended thinking)をどれくらい使うべきかをモデルが判断するAdaptive thinking(適応型思考)や、開発者が知能、速度、コストをより細かく制御できる新しいEffort(労力)コントロールも導入されました。
Claude Codeでは、複数のAIエージェントが連携し、タスクへ共同で取り組む「エージェントチーム」機能が追加されました。API上では「Context compaction」機能を使用することで自身のコンテキストを要約し、制限に達することなく長時間実行されるタスクを処理することができます。
外部連携も強化されており、Excel版Claudeの大幅なアップデートに加えて、PowerPoint版Claudeのリサーチプレビュー版がリリースされました。両者を組み合わせることでExcelで処理・構造化したデータを、PowerPointで視覚的に表現することも可能です。
Anthropicは、Claudeの開発自体にClaudeを利用しています。「Claude Opus 4.6」では、指示なしにタスクの最難関部分に焦点を当て、単純な部分を素早く処理する様子が確認されました。曖昧な問題を的確に判断し、長時間のセッションでも生産性を維持することが実証されています。

ベンチマークにおいても様々な分野でトップクラスの性能を発揮しています。コーディング評価ベンチマーク「Terminal-Bench 2.0」や複雑な学際的推論テストである「Humanity’s Last Exam」で非常に高い性能を記録しました。
大規模なドキュメントから関連情報を取得する能力も大幅に強化されており、会話が一定のトークンを超えるとAIのパフォーマンスが低下するコンテキストの劣化(context rot)問題が、前モデルから大きく改善されました。大量のテキストの中に隠された情報を検索するテスト「MRCR v2」では、前モデルである「Claude Sonnet 4.5」が18.5%であるのに対して「Claude Opus 4.6」では76%のスコアを記録しています。
安全性に関する自動行動監査においても、「Claude Opus 4.6」は欺瞞や追従、ユーザーの妄想の助長、悪用への協力といった不適切な行動の発生頻度が低く抑えられています。また、モデルが無害なクエリに回答できない過剰拒否の発生率に関しては、他のClaudeモデルと比較して最も低くなっています。
サイバーセキュリティに関しては、新しい安全対策が適用されています。6つの有害な反応を検知する手法が開発され、様々な形態の潜在的な悪用を追跡可能です。
出典:Anthropic
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら