DXを推進するAIポータルメディア「AIsmiley」| AI製品・サービスの比較・検索サイト
03-6452-4750 10:00〜18:00 年末年始除く

富士通、生成AI再構成技術を開発。軽量化と世界最高の精度維持率・推論3倍の高速化を実現

最終更新日:2025/09/22

LLMの軽量化と省電力を実現

富士通は、LLMの軽量化・省電力を実現する生成AI再構成技術を開発しました。重みの圧縮による量子化技術と特化型AI蒸留技術の2つで、従来の手法と比較して大幅に優れた性能を実現しています。

このニュースのポイント

  • 富士通は、生成AI再構成技術を開発しLLMの軽量化・省電力を実現
  • LLM「Takane」に量子化技術を適用し1ビット量子化。世界最高の精度維持率・推論3倍の高速化を実現
  • 2025年度下期から量子化技術を用いた「Takane」のトライアル環境を提供し、Cohere社の「Command A」を量子化したモデルをHugging Faceで順次公開予定

富士通株式会社は、AIサービス「Fujitsu Kozuchi」のコア技術として、LLMの軽量化・省電力を実現するAI軽量化技術である生成AI再構成技術を開発し、LLM「Takane」を強化しました。

AIの産業実装が急速に進む一方、基盤となるLLMは大規模化が進み、開発・運用コストの増大や高い消費電力による環境負荷が課題となっています。また、企業が業務でAIを活用する場合、特定の業務に合わせ高精度化するなど、軽量化が不可欠です。

本技術に使われているAIの思考を効率化し、消費電力を削減する量子化技術は、生成AIの思考の基となる膨大なパラメータの情報を圧縮し、大幅に生成AIモデルの軽量化・省電力化と高速化を実現します。


また、専門知識を凝縮し、精度を向上させる特化型AI蒸留技術によって、単なる圧縮に留まらず、特化したタスクでは基盤の生成AIモデルを上回る精度を達成します。

今回、富士通が提供するLLM「Takane」に量子化技術を適用し、1ビット量子化することでメモリ消費率を最大94%削減しました。量子化前と比較し、世界最高の精度維持率である89%と、量子化前の3倍の高速化を実現しています。

量子化技術を適用した「Takane」のトライアル環境は2025年度下期より順次提供予定です。さらに、Cohere社の研究用オープンウェイト「Command A」を本技術により量子化したモデルを、Hugging Faceで順次公開します。

富士通は、今後も生成AIの能力を飛躍的に高めると同時に、その信頼性を保証する研究開発を推進することで、顧客や社会が直面するより困難な課題の解決に貢献し、生成AI活用の新たな可能性を切り拓いていくと述べました。

出典:富士通

AIエージェントサービス 無料相談はこちら

 

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています @AIsmiley.inc
・Xもフォローください @AIsmiley_inc
・Youtubeのチャンネル登録もお願いいたします@aiaismiley1345
メルマガに登録する

DXトレンドマガジン メールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

メールアドレス

メールアドレスを入力してください

AI・人工知能記事カテゴリ一覧

今注目のカテゴリー

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

AI活用のご相談したい企業様はこちら

03-6452-4750

AI製品・ソリューションの掲載を
希望される企業様はこちら