生成AI

最終更新日:2025/12/10
Kimi K2 Thinkingとは?
OpenAI o1(旧Strawberry)のような「深く考えるAI」が、ついにオープンソースで登場しました。中国Moonshot AIが発表した「Kimi K2 Thinking」は、思考プロセスを可視化し、一部のベンチマークではGPT-5の想定スペックをも上回る驚異的な性能を示しています。
本記事では、その実力の検証結果から、無料で使えるチャット機能、そしてローカル環境での構築方法までを徹底解説します。
中国のMoonshot AI社が開発した「Kimi K2 Thinking」は、1兆個のパラメータを持つ大規模なAIモデルです。
このモデルは「MoE(Mixture of Experts:専門家の混合)」と呼ばれる構造を採用しており、タスクに応じて最適な専門分野のAIを自動で使い分けます。一番の特徴は「思考エージェント」としての機能です。一般的なAIが質問に対してすぐ答えを返すのに対し、Kimi K2 Thinkingは人間のように段階的に考えながら回答を組み立てます。
たとえば「この数学の証明を解いて」と依頼すると、問題を分析し、必要な公式を探し、計算を実行し、結果を検証するという一連の思考プロセスを見せてくれます。さらに、256kトークンという長大なコンテキストウィンドウに対応しています。企業の膨大な資料を分析したり、いくつかの文書を比較検討したりする作業に最適です。
Kimi K2 Thinkingは複数の評価テストで、GPT-5やClaude4.5を上回る成績を記録しました。
| 評価項目 | Kimi K2 Thinking | OpenAI o1-preview | GPT-5(High) | Claude 4.5 Sonnet(Thinking) | 解決優位性 |
|---|---|---|---|---|---|
| Humanity’s Last Exam (HLE) | 44.9% | 41.0% | 41.7% | 32.0% | Kimi K2 |
| Browsing Competition | 60.2% | – | 54.9% | 24.1% | Kimi K2 |
| SWE-Bench Verified(コーディング) | 71.3% | 79.2% | 74.9% | 77.2% | Claude 4.5 |
| GPQA Diamond(科学や生物学) | 84.5% | 77.3% | 85.7% | 83.4% | GPT-5 |
| AIME 2025(数学) | 94.5% | 83.3% | 94.6% | 87% | Claude 4.5 |
参考:Moonshotai|Introducing Kimi K2 Thinking
※表中の「GPT-5 (High)」「Claude 4.5 (Thinking)」等の数値は、Moonshot AI社が発表資料において「次世代モデルの性能」として独自に定義・算出した比較用ベースラインです。OpenAIやAnthropicが正式に発表したモデル/数値ではありません。
「Humanity’s Last Exam(HLE)」という専門知識テストでは44.9%のスコアを獲得し、GPT-5の41.7%、Claude 4.5の32.0%を超えました。
このテストは科学、法律、医学などの分野にわたる専門家レベルの問題で構成されており、単なる知識の暗記ではなく、応用力が問われます。ウェブ検索能力を測る「Browsing Competition」では60.2%を達成しました。同じく人間のベースラインや競合モデルを大きく引き離しています。
プログラミング能力を評価する「SWE-Bench Verified」でもGPT-5やClaude4.5と遜色ない正解率を示しました。このテストはGitHub上の実際のバグ修正や機能追加が課題となっており、教科書通りの知識だけでは解けません。
Kimi K2 Thinkingの強みは「Chain of Thought(連鎖的な思考)」技術です。これは、AIが答えを出すまでの思考プロセスを段階的に表示する仕組みです。
前世代の「Kimi K2」では、AIの頭の中で何が起きているかはブラックボックスでした。しかしK2 Thinkingでは、推論の各ステップがログとして記録され、ユーザーが確認できます。「なぜこの答えになったのか」という根拠が明確になり、信頼性が向上しました。
博士レベルの数学問題を解く際にも、まず問題文を分析し、関連する定理を検索し、それを適用して計算を実行し、結果を検証する、というステップで進めることを示しました。単に正解を出すだけでなく、数学者が論文を書くときのような証明プロセスそのものを再現したのです。
Kimi K2 Thinkingは、人間の介入なしに最大200〜300回の「ツール呼び出し」を連続実行できます。ツール呼び出しとは、検索エンジンで情報を探したり、ブラウザでウェブページを開いたり、Pythonでコードを実行したりする操作のことです。
たとえば「ユーザーがタスクを管理できるウェブアプリを作って」という曖昧な指示を受けると、モデル自身がいくつかのサブタスクに分析し、仮説検証を繰り返しながら自律的にゴールを目指します。
従来のモデルは30ステップほどで処理が破綻していました。しかしK2 Thinkingはゴールに向けた挙動を長時間維持できます。

Kimi K2 Thinkingを利用する方法は主に3つあります。公式サイトのチャット機能を使う方法、開発者向けAPIを使う方法、そしてローカル環境で動かす方法です。
技術的な知識がない方でも、公式サイトなら登録後すぐに使い始められます。一方、自社システムに組み込みたい開発者の方はAPIが便利です。データプライバシーを重視する企業は、自前のサーバーで運用するローカル実行を選ぶこともできます。
英語や中国語だけでなく、自然な日本語で指示を出せば、同じように日本語で応答してくれます。ビジネスメールの作成から技術的な質問まで、幅広い用途で活用できるでしょう。
最も手軽な方法は公式サイト「kimi.com」でのチャット利用です。まずサイトにアクセスし、画面左下の「Log in」ボタンをクリックします。

ログイン画面では、Googleアカウントまたは電話番号で登録できます。Googleアカウントを選べば、メールアドレスとパスワードを入力するだけで完了です。電話番号の場合は、SMSで届く認証コードを入力する必要があります。
ログインが完了したら、チャット画面の左側にあるツールバーを確認してください。「Search」の下に「Thinking」というオプションがあるので、これをオンに切り替えます。これで推論機能が有効になり、AIが思考過程を表示しながら回答してくれるようになります。

基本的な機能は無料で利用できます。しかし、高度機能や優先アクセスを求める場合は、月額19ドル〜の有料プランも用意されています。無料版でも十分な性能を体験できるので、まずは試してみることをおすすめします。
自社のアプリケーションやサービスにKimi K2 Thinkingを組み込みたい開発者は、API経由での利用が便利です。まず「platform.moonshot.ai」にアクセスし、開発者登録を行います。
登録後、ダッシュボードでAPIキーを発行できます。


実装は非常にシンプルです。Kimi K2 ThinkingのAPIは、OpenAIのAPI形式と互換性があります。つまり、既存のOpenAI用SDKをそのまま使い、エンドポイントURLとモデル名を変更するだけで動作します。
Pythonでの基本的な実装例は次の通りです。まずopenaiパッケージをインポートし、APIキーを設定します。次にエンドポイントをapi.moonshot.aiに変更し、モデル名をkimi-k2-thinkingに指定します。メッセージ配列に質問内容を入れてリクエストを送ると、JSONフォーマットで回答が返ってきます。
データプライバシーを重視する企業や、インターネット接続が制限された環境で使いたい場合は、ローカル実行が最適です。Kimi K2 Thinkingのモデルデータ(重み)は、Hugging FaceというAIモデル共有プラットフォームで公開されています。

Hugging Faceの公式ページ「moonshotai/Kimi-K2-Thinking」から、モデルファイルを無料でダウンロードできます。容量は大きいですが、一度ダウンロードすれば何度でも利用できます。

このモデルの利点は、INT4量子化に対応していることです。量子化とは、AIの計算精度を下げて処理スピードを上げる技術です。
通常、量子化すると性能が落ちますが、Kimi K2 Thinkingは学習段階から量子化を考慮して作られているため、性能を保ったまま推論スピードを上げられます。
また、自前のサーバーやGPU環境で動かせば、データが外部に送信される心配がありません。ローカル環境でKimi K2 Thinkingを動かすには、相応のハードウェアが必要です。
ローカル環境でKimi K2 Thinkingを動かすには、相応のハードウェアが必要です。
| 項目 | 内容 |
|---|---|
| GPU | NVIDIA RTX 4090 24GB または同等品 |
| RAM | 256GB以上 |
| ストレージ | 500GB以上の空き容量 |
| 想定速度 | 1〜2トークン/秒程度 |
Kimi公式サイトで推奨構成が公開されていないため、あくまで一例です。より高速な応答や高負荷設定を使う場合は、より多くのGPUメモリや強力なCPUが求められます。
Kimi K2 Thinkingはオープンソースプロジェクトとして提供されており、利用形態によって料金が変わります。基本的には無料で使えますが、API経由で大量に利用する場合は従量課金となります。
| 利用形態 | 料金 | 特徴・備考 |
|---|---|---|
| セルフホスト / ローカル実行 | 無料 |
|
| 公式Webチャット
(kimi.com) |
基本無料
(有料プランあり) |
|
| 開発者向けAPI
(Moonshot Platform) |
従量課金 |
|
※2025年11月時点
個人の研究から企業の商用利用まで、幅広いユースケースに対応した柔軟な料金設計です。小規模なテストなら無料で済みますし、本格的なサービス展開でもAPI料金は他社モデルと比較して競争力があります。
特にキャッシュ機能を活用すれば、入力コストを削減できる点が魅力です。同じような質問が繰り返される場合、過去の入力を再利用することでコストを抑えられるでしょう。
API利用料は、入力したテキスト量(入力トークン)と生成された回答量(出力トークン)に基づいて計算されます。トークンとは、AIが処理するテキストの単位で、日本語の場合は約1文字が1トークンに相当します。
| 項目 | 価格 | 備考 |
|---|---|---|
| 入力 (キャッシュあり) | $0.15 | 過去のコンテキストを再利用した場合 (Cache Hit) |
| 入力 (キャッシュなし) | $0.60 | 新規のコンテキスト入力 (Cache Miss) |
| 出力 | $2.50 | 生成された回答テキスト |
参考:Moonshot AI
Webチャット版を頻繁に使う方には、月額サブスクリプションプランも用意されています。
| プラン名 | 月額料金 | 主な特徴・特典 |
|---|---|---|
| Moderato | $19 |
|
| Allegretto | $39 |
|
| Vivace | $199 |
|
参考:kimi.com
Kimi K2 Thinkingは「Modified MIT License(修正MITライセンス)」で公開されています。MITライセンスはオープンソースの世界で最も自由度の高いライセンスの1つで、商用利用、改変、再配布がすべて許可されています。
ただし、1つだけ注意点があります。ユーザー数が1億人を超える大規模サービスで利用する場合は、UIにモデル名を表示する義務が生じます。
研究目的での利用、社内検証、個人開発であれば、ライセンス料は一切発生しません。学術機関がAI研究に使ったり、スタートアップが新サービスを試作したり、プログラマーが学習目的で動かしたりする場合も完全に無料です。

Kimi K2 Thinkingは高性能なAIモデルですが、利用にあたってはデータプライバシーやセキュリティ上の懸念点も存在します。
特に業務で顧客情報や社内機密を扱う場合、入力データがどう処理されるのか、モデルがどこまで自律的に動くのかを把握し、適切なリスク管理を行う必要があります。
デフォルト設定では、ユーザーが入力したプロンプトやアップロードしたファイルが、AIモデルの学習や改善に利用される可能性があります。
社内の機密資料や個人情報を含むデータを入力する場合、学習に使われることに抵抗を感じる方もいるでしょう。
APIの場合は、オプトアウト(拒否)申請が可能です。指定のメールアドレス「membership@moonshot.ai」へ連絡することで、自分の入力データをモデル改善に使わないよう設定できます。
プライバシーポリシーでは、生成されたコンテンツの所有権はユーザーに帰属すると明記されています。また、収集した個人情報を第三者に販売することはないとも説明されています。
オープンソースモデルは透明性が高い反面、悪意ある攻撃者も構造を分析しやすいという側面があります。実際、ベースモデルのKimi K2では、セキュリティ企業による検証でジェイルブレイク(制限を回避する攻撃)などの脆弱性が報告されています。
また、Kimi K2 Thinkingの特徴である長時間の自律操作は、新たなリスクも生みます。最大300ステップにわたるツール操作は、それだけ多くの脆弱性ポイントを持つことになります。
途中のステップでエラーが発生した場合、どこで問題が起きたのかを追跡することが困難です。
さらに、モデルが無制限にアクションを実行できる状況で、どこまで自由を許すべきか、セキュリティ境界の設定も課題となります。
機密データを扱う際は、API経由での利用やローカル環境での運用を検討するなど、適切なセキュリティ対策を講じる必要があるでしょう。
Kimi K2 Thinkingは、GPT-5を上回る推論能力を持つ中国発のオープンソースAIモデルです。思考プロセスを可視化し、最大300回のツール操作を自律実行できる点が特徴です。
公式サイトでの無料利用、API、ローカル実行の3つの方法から選択でき、Modified MITライセンスで商用利用も可能です。ただし、入力データの学習利用やセキュリティ面には注意が必要で、業務利用時は適切なリスク管理が求められます。
アイスマイリーでは「生成AI のサービス比較と企業一覧」を提供しています。最新のAIサービス動向を把握し、比較検討するために以下よりぜひご活用ください。
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら