DXを推進するAIポータルメディア「AIsmiley」| AI製品・サービスの比較・検索サイト
03-6452-4750 10:00〜18:00 年末年始除く

Turing、150億パラメータ規模で世界最高性能の新日本語VLMを公開

最終更新日:2025/05/19

Turing 日本語VLM公開

Turingは、経済産業省/NEDOの生成AI研究支援プログラム「GENIAC」の一環として、日本語と画像を同時に扱う視覚言語モデル(VLM)「Heron-NVILA-Lite」を公開しました。

このニュースのポイント

  • Turingは経済産業省/NEDO による生成 AI 研究支援プログラム 「GENIAC」 の一環として、新たな日本語VLM「Heron-NVILA-Lite」シリーズを公開。
  • パラメータ数の異なる3つのモデル(15B、2B、 1B)を展開。特に15Bモデルは、同規模のオープンモデルより高性能。2BモデルはiPhone上で高速・オフライン推論が可能。
  • 日本語視覚言語モデルにおける世界最大の事前学習用大規模データセット「MOMIJI 」や、三次元自律移動データセット「STRIDE-QAデータセット」など複数成果を公開。

株式会社Turingは、経済産業省/NEDOによる生成AI研究支援プログラム「GENIAC」の一環として、新たな日本語VLM「Heron-NVILA-Lite-15B/2B/1B」を公開しました。

150億パラメータの15Bモデル は「Heron-Bench」で73.5を記録するなど、複数の日本語視覚言語ベンチマークで同パラメータ規模のオープンモデルを上回る性能を達成。20億パラメータの2BモデルはiPhone上で完全ローカルかつ高速に推論可能です。

上記のほかにも、順序を保ったままデータを収録することで文章と画像の対応関係や前後の文脈を自然に学習できるインターリーブ形式で構築した世界最大の日本語画像の大規模データセット「MOMIJI 」や、世界最大規模の言語と三次元情報を伴う自律移動データセット「STRIDE-QAデータセット」など複数成果を公開しています。

Turingは今後も、軽量かつ高性能なMLLMsおよび身体性のあるマルチモーダル基盤モデルの領域において最先端の研究開発を続けることで自動運転領域における技術革新を推進し、完全自動運転車実現を目指していくと述べています。

出典:PR TIMES

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています
@AIsmiley.inc
・Xもフォローください
@AIsmiley_inc
・Youtubeのチャンネル登録もお願いいたします@aiaismiley1345

メルマガに登録する

DXトレンドマガジン メールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

メールアドレス

メールアドレスを入力してください

AI・人工知能記事カテゴリ一覧

今注目のカテゴリー

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

AI活用のご相談したい企業様はこちら

03-6452-4750

AI製品・ソリューションの掲載を
希望される企業様はこちら