生成AI

最終更新日:2025/02/19
中国のAI企業が手掛ける生成AI「DeepSeek(ディープシーク)」が世界的な話題を呼んでいます。OpenAI社の最新モデル「o1」を超えると評価されているDeepSeekモデルの登場は、NVIDIAの株価暴落を引き起こすなど世界的な影響が大きく、「DeepSeekショック」という言葉が誕生するほどの衝撃を与えました。
しかし、DeepSeekの利用にあたって、セキュリティや情報の取り扱いなどの懸念点もあります。本記事では、DeepSeekの特徴や使い方、料金体系、知っておくべき注意点などを詳しく解説します。
DeepSeekとは、中国のAIスタートアップ企業が開発した大規模言語モデル(LLM)です。2025年1月に発表された最新モデルの「DeepSeek-R1」は、開発コストを抑えつつ、OpenAIの最新モデル(OpenAI-o1)と同等の高い性能を持つと評価されています。
また、DeepSeek はオープンソースのため、コードや技術の詳細が公開されています。AI技術の研究開発コミュニティにおける透明性や活動を後押ししている点も特徴です。
DeepSeekの開発元は、中国のAIスタートアップ企業「DeepSeek」です。2023年に中国の起業家である梁文峰(Liang Wenfeng)氏によって設立されました。また、主にAIを用いたトレーディング手法で成功している中国のクオンツヘッジファンド(High-Flyer Capital Management)の資金提供を受けています。
DeepSeekは、商業化よりも技術革新を重視し、オープンソースのLLM開発に力を入れています。専門知識を集約して協調的なイノベーションとリソースの最適化を促進し、競合他社との差別化につなげています。
DeepSeek は、2023年11月にリリースされた最初のモデル「DeepSeek Coder」から進化を遂げ、2025年1月に最新の「DeepSeek-R1」がリリースされました。ここでは、特筆すべき特徴を備えた「DeepSeek-R1」とその前身の「DeepSeek-V3」の2つを詳しく紹介します。
「DeepSeek-V3」は、幅広い用途に対応した万能型AIモデルです。従来とは異なる「Mixture-of-Experts(MoE)アーキテクチャ」を採用し、低コストながら高度な推論を可能にしています。
また、サーチモードを選択すると、Web検索が可能なため、最新情報にもアクセス可能です。多言語翻訳や数学、コーディングなどマルチな性能を持ち合わせており、さまざまなタスクを効率的にこなします。性能は、OpenAIのChatGPT(GPT-4モデル)に匹敵、あるいはそれ以上とも言われ、注目を集めています。
「DeepSeek-R1」は、前述の DeepSeek-V3をベースに開発された新しいモデルです。特に、推論能力が強化されており、論理的推論や難易度の高い数学問題、コーディングタスクで高く評価されています。
開発の過程では、まず「DeepSeek-R1-Zero」が開発されました。教師あり微調整(SFT)を一切行わず、強化学習(RL)のみを適用し、推論能力の向上に成功しています。また、MITライセンスの元でオープンソースとして提供されており、研究者や開発者が自由に利用・改良しながら、幅広い用途に使用できる点も特徴です。
DeepSeekの主な特徴として、開発コストと性能のバランスが挙げられます。小規模かつ低コストながら、圧倒的なスケールで他社の主要LLMをも超えるとされるレベルのモデルを開発しています。また、従来とは異なるアーキテクチャ(MoE)を採用し、推論など各領域において高い評価を得ている点もポイントです。
DeepSeekは、低コストかつ短期間で開発されています。最新かつ最上位モデルの「DeepSeek-R1」は、生成AIの中でも特に高い性能を持つと言われていますが、開発にかかった費用は約550〜600万ドル(約8〜9億円)と主張しています。ChatGPTの開発費用が約10億ドルと言われていることを考えると、比較すると大幅にコストが抑えられていることがわかります。
また、ハードウェアに「Nvidia H800 GPU」を採用し、モデルのトレーニングが約2ヶ月ほどで完了している点も見逃せません。
DeepSeekでは、より効率的かつ費用対効果の高いトレーニングを実現するために、従来とは異なる「MoE(Mixture of Experts)アーキテクチャ」を採用しています。専門家モデルとも呼ばれるこの技術は、名前の通り複数のさまざまな専門家を選択的に活性化することで、幅広い領域に対する高精度な対応が可能です。
従来のニューラルネットワークと異なり、基本的な知識はすべてのトークンに提供された上で、入力ごとに異なる専門家モデルがタスク処理を担当します。また、計算負荷を分散するために動的な調整を行えるため、戦略的に高い性能を維持できます。
MoEアーキテクチャによって、メモリ使用量を抑えつつ、効率的な学習と推論能力を実現しています。
DeepSeek-R1 の前身となる中間推論モデル(DeepSeek-R1-Zero)のトレーニングより、教師ありファインチューニング(SFT)を行わず、大規模な強化学習(RL)を実施しています。
ChatGPT や Claude などの LLM では、一般的に性能を向上させるために SFT が用いられるため、学習データの収集やアノテーションに膨大なコストがかかります。また、大規模モデルの学習には膨大な計算リソースが必要で、一部の大手企業や研究期間しかアクセスできないという課題もありました。
これらの課題を解決するために、DeepSeek-R1 ではSFTを割愛し、コアとして純粋な強化学習(RL)のみを活用して、推論能力を強化しています。さらに、R1-Zero モデルの出力を用いた SFT データを作成し、さらなる強化学習でファインチューニングを実施することで最適化を図っています。
DeepSeekは、R1 モデルを使用した「蒸留」に成功していることがわかっています。蒸留とは、高性能なLLMで習得した知識を、小規模なモデル(SLM)へ移植する技術のことです。新しいモデルの学習をゼロから行うよりも、圧倒的に効率良くトレーニングを実施できます。
R1 モデルから、Qwen2.5 や Llama3 といったオープンソースモデルに知識を転移し、ファインチューニングによってより効率的なAIモデルの構築を実現しています。
DeepSeekは、低コストながら圧倒的なスケールで、高い機能性を持つモデルです。約6,710億という膨大なパラメータと、約14.8兆トークンの学習データでトレーニングされています。これは、他社の主要なLLMと比較しても非常に大きい規模と言えます。
この仕組みには、R1-Zero モデルの学習に用いられている「GRPO(Group Relative Policy Optimization)」技術が役立っています。GRPO は、出力グループごとの相対評価に、平均や標準偏差を用いることで簡略化した独自の強化学習アルゴリズムです。報酬のばらつきを抑えて学習を安定化させることで、推論能力を自然に獲得し、自己検証と推論の連鎖を円滑に実行できます。
DeepSeekの性能は、実際にどのようなベンチマークで評価されているのでしょうか。具体的な数値と、他社のLLMモデルとの比較について紹介します。
以下の表は、各ベンチマークにおけるDeepSeekとOpenAI-o1モデルの評価をまとめたものです。
DeepSeek-R1 | OpenAI-o1-1217 | DeepSeek-V3 | |
AIME 2024 | 79.8 | 79.2 | 39.2 |
Codeforces | 96.3 | 96.6 | 58.7 |
GPQA Diamond | 71.5 | 75.7 | 59.1 |
MATH-500 | 97.3 | 96.4 | 90.2 |
MMLU | 90.8 | 91.8 | 88.5 |
SWE-bench Verified | 49.2 | 48.9 | 36.8 |
高度な数学問題を含むテスト(AIME)や競技プログラミングの能力テスト(Codeforces)において、OpenAI-o1 とほぼ同等の正解を出しています。
また、知識ベースを用いた質問応答能力(GPQA Diamond)ではOpenAI-o1よりも低い結果であるものの、数学能力の指標(MATH-500)や一般的な言語問題(MMLU)、そしてプログラミングのコード修正やエラー解消などの能力を評価する指標(SWE-bench)においてはOpenAI-o1 を上回っています。
DeepSeekは、公式サイトまたはスマホアプリから無料で利用できます。最新モデルの R1 も選択可能です。API経由の場合は従量課金制のため、入力トークン数と出力トークン数に基づき、以下の料金が発生します。
項目 | 料金(100万トークンあたり) |
---|---|
入力トークン(キャッシュヒット時) | 0.14ドル |
入力トークン(キャッシュミス時) | 0.55ドル |
出力トークン | 2.19ドル |
R1 の出力トークンには、自己検証から推論結果の出力まですべてのトークンと最終的な回答が含まれます。
ここからは、DeepSeekの操作方法を紹介します。DeepSeekの公式サイトやスマホアプリの他、API 経由や Microsoft Azureなどさまざまなプラットフォームから利用できます。
DeepSeekの Webチャットの使い方は、以下の通りです。
1. DeepSeekの公式サイトにアクセスし、「アカウントを作成またはログイン」に進む
2. 希望する方法(メールアドレス、中国の電話番号、Googleアカウント)で登録する
3. チャット入力欄に質問やプロンプトを入力し、Enterキーを押すと回答が作成される
メイン画面は、他の主要な対話型生成AIサービスと似た構成で、迷うことなく使用できるでしょう。「R1」モデルに変更する場合は、入力欄の「DeepThink」ボタンをクリックすることで有効化されます。
DeepSeekでは、OpenAI 互換のAPIを提供しています。自身のアプリケーションやサービスにDeepSeekを組み込んで、開発に利用することが可能です。APIの利用手順は以下の通りです。
1. DeepSeekの Webサイトでアカウントを作成する
2. 「Billding」>「APIキー」に進み、APIキーを取得する
APIを利用する場合は先に料金を支払う必要があります。
DeepSeekのスマホアプリは、iOS版・Android 版が用意されています。以下の手順でセットアップできます。
1. ストアからDeepSeekアプリをインストールする
2. メールアドレス、中国の電話番号、Googleアカウント連携のいずれかで登録する
3. 登録が完了したら、入力欄に質問を打ち込む
DeepSeekアプリは、日本語に対応しています。また、「R1」モデルへの変更や Web検索も可能です。
DeepSeekは、2025年1月に Microsoft Azure 上のモデルカタログに追加されており、Azureユーザーはプラットフォーム上で利用できます。
1. Microsoft Azureにサインインし、モデルカタログで「DeepSeek R1」を検索する
2. 「DeepSeek R1」のモデルカードを選択し、「デプロイ」ボタンをクリックする
3. 推論 APIキーを取得すると、APIキーと詳細情報が表示される
世界に衝撃を与えた DeepSeekですが、さまざまなリスクや課題も指摘されています。ここでは、現在出ている DeepSeekに関する懸念点や注意点について解説します。
DeepSeekでは、有害なコンテンツを引き出すテストにおいて、50もの悪意のあるプロンプトをすべて通してしまったという調査報告が出ています。LLMのセキュリティを回避して、不適切な回答を生成するこの行為は「ジェイルブレイク(脱獄)」と呼ばれ、生成AIにおける重大な問題の1つです。
悪意ある攻撃の成功率が100%を達成した今回の調査結果は、DeepSeekの安全性が他社の対策に及ばない可能性があることを示しています。
DeepSeekの開発について、低コストであることに加え、最先端半導体を必要としない点も注目に値します。一般的には、高性能なAIを開発するためには最先端半導体が不可欠とされています。
しかし、軍事利用などの懸念から、アメリカは2022年10月より最先端半導体の中国への輸出を規制しているため、高性能な半導体を開発に使用できた可能性は低いです。つまり、DeepSeekはアメリカから輸入できた最新ではない製品を用いて、OpenAI-o1に匹敵する生成AIを作った、という主張が出ており、半導体輸出規制の有効性に対する疑念が浮上しています。
DeepSeekでは、政治に関する情報や社会的にセンシティブな質問に対して、回答が制限される可能性があります。中国のインターネット規制当局によって生成AIの出力内容が監視されており、天安門事件や政権批判につながるトピックは避けられる仕組みです。
世界が自由な表現や対話と情報へのアクセスを目指し、AI開発を進めていることを考えると、相容れない規制だと言えます。
DeepSeekだけでなく、生成AIを利用する際には利用規約やプライバシーポリシーを確認することが重要です。DeepSeekにおいては、ユーザーの個人情報を収集し、中国国内のサーバーに保存する旨がプライバシーポリシーに記載されています。
収集対象は、アカウント登録情報をはじめ、デバイス情報、入力テキストや音声、チャットの履歴などです。また、データは中国の法律に基づいて取り扱われるため、日本の個人情報保護法が適用されない可能性があります。
利用に際しては中国の法律に準拠することが定められており、中国の裁判所が管轄であるため、日本国内の法律適用が制限される可能性がある点にも注意が必要です。
DeepSeekは、主要な生成AIと同様に、日常生活からビジネスまで幅広いシーンで活用できます。2025年1月には、NVIDIA や Microsoft、Amazonといった大手企業が、相次いで R1モデルを自社AIサービスに組み込むことが発表されました。
現在 Microsoftでは、生成AI開発ハブの「Azure AI Foundry」に DeepSeek-R1 を正式に組み込みました。今後のモデル開発の進捗や状況次第では、さらに多くの世界的企業と連携する可能性もあります。
DeepSeekの登場は、AI業界を超えて、金融市場や情報事業にも大きな影響を与えました。最新モデルの「R1」は、推論能力に特化した LLMで、OpenAI-o1に匹敵する高度な能力を持つと評価されています。
ただし、悪意あるプロンプトへの反応や情報漏えいのリスク、トラブル時の対応など懸念点も出ており、利用の際には注意が必要です。
アイスマイリーでは、生成AIサービスと提供企業の一覧を無料配布しています。自社での業務効率化や業務負担の軽減に向けて、最適なAIサービスを選定するためにぜひご活用ください。
DeepSeek ショックとは、DeepSeek の発表を受け、2025年1月27日にアメリカのNVIDIAの株価が急落した出来事です。低コストながらOpenAIに引けを取らない高性能な生成AIツールとしてDeepSeekが登場し、iPhone向けアプリは無料アプリランキングの1位を獲得しました。
これをきっかけに、アメリカ株式市場において知名度の高いハイテク株が下落し、一時は時価総額で約6,000億ドル(約92兆円)近い価値が一気に失われたと報道されています。
DeepSeek は、公式サイトとスマホアプリいずれも日本語に対応しています。また、英語など複数の言語に対応しており、翻訳も可能です。
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら