生成AI

最終更新日:2024/06/28
ELYZAは、Meta社の「Llama 3」を基にした最新モデル「Llama-3-ELYZA-JP-70B」と「Llama-3-ELYZA-JP-8B」を開発し、その性能を公開しました。
このニュースのポイント
株式会社ELYZAは、大規模言語モデル「ELYZA LLM for JP」シリーズの最新モデルとして、Meta社の「Llama 3」を基にした「Llama-3-ELYZA-JP-70B」(700億パラメータ)と「Llama-3-ELYZA-JP-8B」(80億パラメータ)を開発し、その性能を公開しました。
「Llama-3-ELYZA-JP-70B」は、Meta社の「Llama-3-70B」をベースに追加の学習(日本語追加事前学習・指示学習)を実施して開発されたモデルです。
「Llama-3-ELYZA-JP-70B」は、元モデルの「Llama-3-70B」から大きく日本語性能が向上しています。日本語の性能を測定するための2つのベンチマークを用いた自動評価において、国内モデルの中では最高性能の水準を実現。「GPT-4」や「Claude 3 Sonnet」、「Gemini 1.5 Flash」と同等、あるいは上回る性能を達成しています。
「Llama-3-ELYZA-JP-70B」は、安全なAPIサービスや共同開発プロジェクトなどを通して、様々な形態で、順次企業向けに提供が開始されます。
また、同時に発表された「Llama-3-ELYZA-JP-8B」は、Meta社の「Llama-3-8B」をベースに事後学習(日本語追加事前学習・指示学習)を実施して開発したモデルです。
「Llama-3-ELYZA-JP-70B」同様に、「Llama-3-ELYZA-JP-8B」も、元の「Llama-3-8B」から大きく日本語性能が向上しています。80億パラメータの軽量なモデルでありながら、日本語の性能を測定するための2つのベンチマークを用いた自動評価において、「GPT-3.5 Turbo」や「Claude 3 Haiku」、「Gemini 1.0 Pro」に匹敵する性能を達成しています。
ELYZAは、「Llama-3-ELYZA-JP-8B」モデルを一般公開します。本モデルはLLAMA 3 COMMUNITY LICENSEに準拠し、Acceptable Use Policyに従う限り、研究および商業目的での利用が可能です。
ELYZAは、これらのモデルの公開・提供を通じて、国内における LLM の社会実装の推進、並びにLLMの研究開発の発展を支援していく方針です。
出典:PR TIMES
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら