NTT、日本語特化の軽量LLM「tsuzumi」を発表
最終更新日:2023/11/02
NTTは、軽量で高性能な日本語LLM「tsuzumi」を発表しました。2024年3月に商用サービスを提供開始します。
このAIニュースのポイント
- 「tsuzumi」は軽量でありながら世界トップレベルの日本語処理性能を持つ大規模言語モデル
- 従来のLLMに比べ、学習・推論コストを大幅に削減
- 各業界特化とマルチモーダル対応を計画
2023年11月1日、日本電信電話株式会社(NTT)は、自社開発の新しい大規模言語モデル「tsuzumi」を2024年3月に商用サービスとして提供開始すると発表しました。この言語モデルは、既存のGPT-3.5やGPT-3モデルに比べて学習コストを大幅に削減しながら、特に日本語処理において世界トップレベルの性能を示します。
軽量でありながら高性能な「tsuzumi」は、1GPUまたはCPUで高速に動作し、エネルギー消費とコストの問題を軽減することでサステナビリティと経済性を両立しています。提供モデルは、パラメーターサイズが6億の超軽量版と70億の軽量版を開発しており、OpenAI社のGPT-3の1750億パラメーターと比較すると、超軽量版は約300分の1、軽量版は25分の1のパラメーター数です。
「tsuzumi」は日本語と英語に対応しており、NTTの長年の研究を基に、高い処理性能を実証しています。このモデルは、特定の業界に特化したサービス提供を目指しており、柔軟なアダプタ技術を用いることで特有の言語表現や知識へのチューニングが可能です。また、メディカルやコンタクトセンター分野などでの先行トライアルが進行中で、将来的には多様なLLMが協力して社会課題を解決するビジョンを持っています。
マルチモーダル機能の計画も進められており、将来的には言語だけでなく視覚や聴覚の情報も統合し、現実世界での人との協調作業を可能とするような、マルチモーダルへの対応も予定しています。
また今回NTTは、IOWN APNを利用したLLM学習環境を構築し「tsuzumi」の学習を行っています。これにより数百km離れたデータセンタ間でGPUとストレージを接続し、安全かつ性能低下の非常に少ないLLM学習環境を実現しています。
さらに「tsuzumi」はオンプレミス環境でも運用が可能なため、業界に固有なデータを柔軟・セキュアに学習することができ、業界に特化したLLMの構築が可能です。
NTTは、商用サービス提供後もチューニング機能の充実やマルチモーダルの実装についても順次展開していくとコメントしています。また、サイバーセキュリティ分野への応用も視野に入れており、NTTはこれらの技術開発を通じて、顧客体験の向上と新たな価値創造に向けて取り組むことを目指しています。
- AIサービス
- 生成AI
- AI研究開発
- LLM
- DX推進
- 自然言語処理-NLP-
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI・人工知能記事カテゴリ一覧
AI・人工知能サービス
- 生成AI
- 画像生成AI
- ChatGPT
- AI研究開発
- LLM
- DX推進
- おすすめAI企業
- チャットボット
- ボイスボット
- 音声認識・翻訳・通訳
- 画像認識・画像解析
- 顔認証
- AI-OCR
- 外観検査
- 異常検知・予知保全
- 自然言語処理-NLP-
- 検索システム
- 感情認識・感情解析
- AIモデル作成
- 需要予測・ダイナミックプライシング
- AI人材育成・教育
- アノテーション
- AI学習データ作成
- エッジAI
- IoT
- JDLA
- G検定
- E資格
- PoC検証
- RPAツール
- Salesforce Einstein
- Watson(ワトソン)
- Web接客ツール
- サプライチェーン
- メタバース
- AR・VR・デジタルツイン
- MI
- スマートファクトリー
- データ活用・分析
- 機械学習
- ディープラーニング
- 強化学習
- テレワーク・リモートワーク
- マーケテイングオートメーション・MAツール
- マッチング
- レコメンド
- ロボット
- 予測
- 広告・クリエイティブ
- 営業支援・インサイドセールス
- 省人化
- 議事録自動作成
- 配送ルート最適化
- 非接触AI
業態業種別AI導入活用事例
今注目のカテゴリー
AI製品・ソリューションの掲載を
希望される企業様はこちら