生成AI

最終更新日:2025/05/19
Turingは、経済産業省/NEDOの生成AI研究支援プログラム「GENIAC」の一環として、日本語と画像を同時に扱う視覚言語モデル(VLM)「Heron-NVILA-Lite」を公開しました。
このニュースのポイント
株式会社Turingは、経済産業省/NEDOによる生成AI研究支援プログラム「GENIAC」の一環として、新たな日本語VLM「Heron-NVILA-Lite-15B/2B/1B」を公開しました。
150億パラメータの15Bモデル は「Heron-Bench」で73.5を記録するなど、複数の日本語視覚言語ベンチマークで同パラメータ規模のオープンモデルを上回る性能を達成。20億パラメータの2BモデルはiPhone上で完全ローカルかつ高速に推論可能です。
上記のほかにも、順序を保ったままデータを収録することで文章と画像の対応関係や前後の文脈を自然に学習できるインターリーブ形式で構築した世界最大の日本語画像の大規模データセット「MOMIJI 」や、世界最大規模の言語と三次元情報を伴う自律移動データセット「STRIDE-QAデータセット」など複数成果を公開しています。
Turingは今後も、軽量かつ高性能なMLLMsおよび身体性のあるマルチモーダル基盤モデルの領域において最先端の研究開発を続けることで自動運転領域における技術革新を推進し、完全自動運転車実現を目指していくと述べています。
出典:PR TIMES
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら