生成AI

最終更新日:2026/02/09
LMArenaとは?
新しいAIを業務に導入する前に、公開されているベンチマークの結果を確認する方は多いでしょう。しかし、数値上の評価と実際に使った時の使用感が必ずしも一致しないと感じた経験はありませんか。
各ベンチマークは特定のタスクや目的に特化していますが、ユーザーの実務における使い方と必ずしも一致しているとは限りません。そのため、最終的には無料プランなどを用いて、実際に使って比較検証する必要がありました。
この記事ではAIを比較検討する際に必要な試用期間をできるだけ減らすことができるプラットフォーム、LMArenaについて詳しく解説します。

画像出典:LMArena公式ホームページ
LMArenaとはUCバークレーの研究者によって開発された、複数のAIモデルを同じ条件で実際に使いながら比較できるユーザー参加型の評価プラットフォームです。
LMArenaは単なる性能比較ツールではなく、以下の明確な思想に基づいて設計されています。
| 項目 | 内容 |
| Our Mission(ミッション) | すべての人に最高のAIモデルを届け、実世界でのコミュニティ評価を通じてAIをより良くしていくこと |
| Our Vision(ビジョン) | 最高水準のAIを誰もが試せるオープンな場をつくり、集合知によるフィードバックを通じてAIの未来を形づくること |
LMArenaはAIの未来をもっと良くしたいと考える作り手、使い手が協力してその知恵や経験を共有し、AIを改善していく場だと言えるでしょう。

画像出典:LMArena公式ホームページ
LMArenaの公式ホームページにアクセスすると、画面左上にプルダウンが表示されます。
このプルダウンでは「Battle」「Side by Side」「Direct chat」の3つを選ぶことができ、使い方がそれぞれ異なるため1つずつ見ていきましょう。
LMArenaのBattleモードでは自分の入力したプロンプトに対する回答内容において、2つのAIモデルをモデル名を伏せた状態で比較することができます。
これは「有名だから」「人気があるから」といった認知バイアスを排除し、回答内容そのものを公平に評価するための仕組みです。
LMArenaのBattleモードの使い方の手順は以下の通りです。
画像出典:LMArena公式ホームページ
画像出典:LMArena公式ホームページ
画像出典:LMArena公式ホームページ
画像出典:LMArena公式ホームページ
画像出典:LMArena公式ホームページ利用規約とプライバシーポリシーへの同意画面には、特に重要なポイントとして以下の事項が記されています。
どのAIを使用する上でも留意しなければならない内容なので、必ず目を通しておきましょう。
またBattleモードの操作手順は、文章生成AIを普段活用している人であればそれほど難しいものではないため、直感的に理解しやすいでしょう。
Battleモードは業務で使用するプロンプトに対する回答の品質を、自分の先入観を入れずに比較検討したい人におすすめです。
参考:LMArenaヘルプセンター「LMArena:バトルモードの使い方」
参考:LMArenaヘルプセンター「LMArena:画像生成の使い方」
LMArenaのSide by Sideモードでは、入力したプロンプトに対する回答内容をもとに、選択した2つのAIモデルを比較できます。
LMArenaのSide by Sideモードの使い方の手順は次の通りです。
画像出典:LMArena公式ホームページ
画像出典:LMArena公式ホームページ
画像出典:LMArena公式ホームページ
画像出典:LMArena公式ホームページGemini-3-proとgpt-5.2の回答を比較すると、例えばAIを導入するメリットではGemini-3-proが客観的な事実、gpt-5.2はベネフィットを重視した回答をしているのがわかります。
Side by Sideモードは得意分野が異なるAIモデルを、業務においてどのように使い分けるかを考えたい人におすすめです。
Direct chatモードでは、好きなAIモデルを1つ選択してその回答生成を体験できます。
LMArenaのDirect chatモードの使い方の手順は以下の通りです。
画像出典:LMArena公式ホームページ
画像出典:LMArena公式ホームページ
画像出典:LMArena公式ホームページLMArenaのDirect chatモードは、それぞれのAIモデルの個性をより明確に確認したい人におすすめです。
LMArenaのランキングは、ユーザーによる投票結果をもとに作成されており、「Last Updated」に記載された日付時点での評価を反映しています。
ランキングの種類は次の通りです。
| 項目 | 概要 |
| Leaderboard Overview(全体ランキング) | テキスト、画像、動画など、さまざまな分野において主要なAIモデルがどのように評価されているかを一覧で確認できる |
| Text Arena(テキスト生成ランキング) | 文章生成における汎用性、言語の正確さ、文脈理解力、文化的背景への配慮といった観点から、複数の大規模言語モデル(LLM)を比較できる |
| WebDev Leaderboard(Web開発向けランキング) | Code Arenaで実行されたWeb開発タスクをもとに、Webサイトやアプリケーション開発におけるAIモデルの性能を比較できる |
| Vision Arena(画像理解・視覚処理ランキング) | 画像を理解・解析できるマルチモーダル生成AIモデルを対象に、視覚情報処理能力の観点から評価・比較できる |
| Text-to-Image Arena(画像生成(テキスト→画像)ランキング) | テキストで与えられた指示内容にどれだけ忠実な画像を生成できるかという観点で、AIモデルを比較できる |
| Image Edit Arena(画像編集・生成ランキング) | 既存画像の編集や新たな画像生成における性能を基準に、各AIモデルを比較できる |
| Search Arena(検索連携型AIランキング) | Web検索機能を備えたLLMを対象に、リアルタイム情報の取得能力、外部知識の活用、根拠のある引用を含む回答精度を比較できる |
| Text-to-Video Arena(動画生成(テキスト→動画)ランキング) | 与えられたテキストプロンプトをもとに、どの程度適切な動画を生成できるかを基準にAIモデルを比較できる |
| Image-to-Video Arena(動画生成(画像→動画)ランキング) | 入力した画像をもとに動画を生成する能力について、AIモデル同士を比較できる |
ランキングは自分の活用したい用途に応じて確認するのがおすすめです。
参考:LMArena公式ホームページ「Leaderboard」

LMArenaを使用するにあたって確認しておきたい規約を3つご紹介します。
LMArenaを業務で使用するなら、プライバシーポリシーの以下の内容を理解しておきましょう。
海外の法律が適用される地域で個人情報が管理されることを想定し、機密情報を入力しないなどの運用ルールをあらかじめ決めておくことが大切です。
LMArenaの利用規約では、アカウントやサービスにおける不正利用の禁止、入力内容や出力内容の取扱い、サービスの品質や継続性について保証しないこと、規約変更・サービス終了の可能性についてなどが定められています。
特に業務で使う際は、利用規約の内容が変更される可能性があることを前提に、定期的に確認した上でルールを守ったサービス利用を心がけましょう。
LMArenaのクッキーポリシーでは、Cookieやピクセルタグなどの利用技術、利用目的、Cookieの管理と拒否について定められています。
業務で使用する際はCookieの利用目的を理解し、必要があればCookieの設定画面からその利用可否を適宜変更しながら使用することが大切です。
2026年2月現在LMArenaの利用にかかる料金は無料です。
しかし利用規約におけるSection8の冒頭部分に、現状はサービスを無料提供しているものの将来的には課金する可能性があると明示されています。
業務で使用する際は、将来的には費用が発生することを踏まえて活用することが大切です。
LMArenaとはUCバークレーの研究者によって開発された、複数のAIモデルを同じ条件で実際に使いながら比較できるユーザー参加型の評価プラットフォームです。
この記事も参考にして、ぜひ自分の業務に合ったAIモデルを見つけてみてください。
アイスマイリーでは、生成AI のサービス比較と企業一覧を無料配布しています。課題や目的に応じたサービスを比較検討できますので、ぜひこの機会にお問い合わせください。
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら