DXを推進するAIポータルメディア「AIsmiley」| AI製品・サービスの比較・検索サイト
03-6452-4750 10:00〜18:00 年末年始除く

ストックマーク、世界最高クラスのマルチモーダル基盤モデルを公開。日本語領域においてGPT-4oを上回る

最終更新日:2025/06/05

GPT-4o超え国産AIモデル公開

ストックマークは、ハルシネーションを大幅抑止した、フルスクラッチ開発による1,000億パラメータのドキュメント読解基盤モデル「Stockmark-2-VL-100B」を公開しました。

このニュースのポイント

  • ストックマーク、ハルシネーションを大幅に抑制した1,000億パラメータのマルチモーダル基盤モデル「Stockmark-2-VL-100B」を公開
  • 日本語ドキュメント読解性能で「GPT-4o」を上回る評価、さらに思考過程を段階的に生成する「チェーンオブソート(Chain of Thought)」を実現
  • 画像読解能力においても国産モデルで最高クラスの性能、ドキュメント読解に限らず多方面で活用可能

ストックマーク株式会社は、経済産業省とNEDOが実施する国内の生成AI開発力強化を目的としたプロジェクト「GENIAC」第2期で、ハルシネーションを大幅に抑止した1,000億パラメータのドキュメント読解基盤モデル「Stockmark-2-VL-100B」を公開しました。


「Stockmark-2-VL-100B」は、国産の日本語特化型LLM「Stockmark-2-100B-Instruct-beta」に、図表や画像を含む複雑なドキュメントの学習を加えたもので、日本語市場において「GPT-4o」を超える性能を持つ世界最高峰のマルチモーダル基盤モデルです。


日本語ドキュメントの読解能力に関しては、一般的なマルチモーダル基盤モデルの性能評価で用いられる「JChartQA」と、同社独自開発の日本語及びビジネス領域におけるドキュメント読解性能を評価する「BusinessSlideVQA」を用いて性能を比較した結果、双方の評価で「GPT-4o」を上回りました。

また、生成AIが複雑な質問に回答する際、思考過程を段階的に生成する「チェーンオブソート(Chain of Thought)」を実現しており、ビジネスシーンでも信頼して活用できます。


一般的な画像読解能力においても、国産モデルの中では最高クラスの性能を有しており、ドキュメント読解に限らず多方面で当モデルが活用できます。

「GENIAC」第2期にて開発した「Stockmark-2-100B-Instruct-beta」と「Stockmark-2-VL-100B」の2つの基盤モデルは、商用利用可能モデルとして公開しています。

短期的な展望として、同社サービスである「Anews」「SAT(Stockmark A Technology)」の2つのサービスへの実装や、お客様へ基盤モデルを直接提供します。また、中期的には基盤モデルの更なる性能強化、及び小型化などを行う予定です。

ストックマーク 取締役 CTO 有馬 幸介 氏は「Stockmark-2-VL-100B」が信頼性の高いAIとして社会課題の解決に貢献し、広く活用されることを目指すと述べました。

出典:PR TIMES

AIsmiley編集部

株式会社アイスマイリーが運営するAIポータルメディア「AIsmiley」は、AIの専門家によるコンテンツ配信とプロダクト紹介を行うWebメディアです。AI資格を保有した編集部がDX推進の事例や人工知能ソリューションの活用方法、ニュース、トレンド情報を発信しています。

・Facebookでも発信しています
@AIsmiley.inc
・Xもフォローください
@AIsmiley_inc
・Youtubeのチャンネル登録もお願いいたします@aiaismiley1345

メルマガに登録する

DXトレンドマガジン メールマガジン登録

業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。

お名前 - 姓・名

お名前を入力してください

メールアドレス

メールアドレスを入力してください

AI・人工知能記事カテゴリ一覧

今注目のカテゴリー

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

生成AI

ChatGPT連携サービス

チャットボット

AI-OCR

AI活用のご相談したい企業様はこちら

03-6452-4750

AI製品・ソリューションの掲載を
希望される企業様はこちら