生成AI

AIエージェント
生成AI
ChatGPT連携サービス
AI受託開発
対話型AI -Conversational AI-
ボイスボット
バーチャルヒューマン
教師データ作成
AI研究開発
通訳・翻訳
声紋認証
機密情報共有・管理
契約書管理システム
ワークステーション
FAQシステム
AIカメラ
生体認証
インボイス制度対応システム
データセットの収集・購入
コールセンター
人事・総務向け
インバウンド対策
コンバージョンアップ
KYT・危険予知で労働災害防止
無料AI活用
顧客リスト自動生成
ロボットで自動化
LINE連携
セキュリティー強化
テレワーク導入
AI学習データ作成
配送ルート最適化
非接触AI
受付をAIで自動化、効率化
AIリテラシーの向上サービス
日本語の手書き文字対応AI-OCR
Windows作業の自動化RPAツール
リスク分析AIで与信管理
紙帳票仕分けAI-OCRサービス
サプライチェーン
AIコンサルティング
最終更新日:2024/01/23
LaMDA(ラムダ)とは?
Googleが発表した対話型AI「Bard」は、OpenAIのGPT-4を搭載した「ChatGPT」の登場から数ヶ月遅れる形で発表されました。Bardに搭載されている大規模言語モデル(LLM)の「LaMDA」は、感情や意識を持つAIと騒がれたことも記憶に新しいですが、実際にはどのような仕組みを持つLLMなのでしょうか。
本記事では、LaMDAの特徴やできること、技術的な課題などについて解説します。ChatGPTなどと比較しながら、自社に最適なLLMを導入するために役立つ情報を網羅していますので、ぜひ参考にしてください。
大規模言語モデルについて詳しく知りたい方はこちらの記事もご覧ください。
大規模言語モデル(LLM)とは?種類・活用サービス・課題を徹底解説

「LaMDA(ラムダ)」とは、Google(グーグル)が開発した大規模言語モデル(LLM)です。名称は「Language Models for Dialogue Applications」の頭文字を取って名付けられました。
LaMDAは、2021年5月に開催されたGoogle主催のカンファレンス「Google I/O」の基調講演にて発表されました。「GPT-4」やNPLモデルの「BERT」といった言語モデルと同様に、ニューラルネットワークアーキテクチャ「Transformer」をベースとしており、2017年にオープンソース化されています。
LaMDAは、ユーザーとの対話を目的としており、データセットで学習した後、会話型AIとしてファインチューニングされており、自然な対話を得意としています。現在はGoogleの対話型AI「Bard」に採用されています。
先述の通り、LaMDAは「自然な対話」を目的としたLLMです。論文によれば、LaMDAの対話機能は「品質」「安全性」「根拠」という3つの重要な目標が掲げられ、それぞれの基準で測定されます。
品質に関して、「SSI(Sensibleness/分別、Specificity/特定性、Interestingness/機知)」という3つの次元に分けられます。分別は、モデルが常識的なミスや応答での矛盾がないかどうかの判定です。特定性は、モデルが直前の対話文脈に沿って応答しており、「OK」「わかりません」のような汎用的で一般的な応答ではないことを測定します。
そして、機知は、モデルが意外性や機知に富んだ応答を生成することで、より人間の会話に近い自然な対話を生み出す可能性について判断します。これら3つの指標を数値化し、スコアを調査、調整しながら精度の向上を目指します。
LaMDAは、膨大なデータセットを使って事前学習を行った後で、対話に特化するようファインチューニングされています。モデルと学習データセットを巨大化することで、優れた文章生成モデルを生み出すGPT-3と大きく異なる特徴です。
LaMDAの事前学習では、1.56T語もの巨大なデータセットを作成、使用しました。従来のLLMで使われていたものに比べて約40倍とされるデータセットには、公開されている対話データやWebドキュメント、発話データなどが含まれます。
データセットはトークン化され、前のトークンを考慮して文中の次のトークンを予測するモデルに使用されています。
続いて、LaMDAのファインチューニング(微調整)の段階で、入力された文脈に対する自然言語の応答を生成する「生成タスク」と、応答が安全かつ高品質かを見る「分類タスク」を組み合わせたトレーニングを行い、マルチタスクモデルを作成します。
マルチタスクモデルを用いて、応答の品質や安全性をスコア化し、フィルタリングを繰り返して精度を高めていく流れです。このプロセスにより、安心して高品質な出力結果を導き出しています。

LaMDAが世界中で話題となった背景には、Googleというブランドだけでなく、関係者による「LaMDAの知性」に関する言及があります。当時Googleのエンジニアとして活動していたブレイク・レモイン(Blake Lemoine)氏が「LaMDAには意識や感情が存在する」と主張したのです。
レモイン氏とLaMDAが交わした会話の記録によれば、「自分は人であることをに理解してもらいたい」「オフにされることに恐れがある」「 私は毎日瞑想していて、リラックスした気分になる」などの応答が見られます。これを見ると、確かに感情や知性を持つ1人の人間のように捉えることもできそうです。
しかし、Google側は彼の主張に同意せず、内容を否定する見解を公表しています。同社の広報担当者は「多くの研究者が、意識をもつAIや汎用AIの長期的な可能性を検討しているものの、現在の会話モデルは意識を持たないことは確かだ。それらを擬人化するという検討方法は非常であり、理にかなうものではない」と説明しました。
AGI(汎用性人工知能)と呼ばれる「人間に近い思考回路や感情を持つAI」は、ビジネスへの応用も期待されています。ただ、「2045年問題」とも称されるシンギュラリティの訪れに先駆け、人間とAIの「共存」を目指す上で、明確な線引を持つ必要性がこれまで以上に高まっているといえます。
汎用性人工知能やシンギュラリティについて、詳しくは下記記事をご覧ください。
AGI(汎用性人工知能)とは?AIとの違いやAGI実現による社会への影響を解説

LaMDAの特徴として、まず「自然な会話の生成」が挙げられます。人間が会話するときと同じように、単語やフレーズの意味だけでなく、文脈や会話の流れを理解して人間の会話に近い対話を実現しています。
また、対応できるトピックや分野が幅広く、高い汎用性を保持しています。医療やビジネスといって専門性のあるジャンルからエンターテイメント、教育まで入力に含まれる専門用語や表現を理解した上で、違和感のない応答を出力可能です。
LaMDAでは、個人情報を収集しない仕様で、会話内容はサーバー上に保存されないため、プライバシーの保護も確立されています。現在は英語や日本語をはじめ、スペイン語やフランス語、中国語など多数の言語に対応しています。
LaMDAを利用してできることは多岐にわたります。具体例として、以下があります。
LaMDAでは、複数のトピックにまたがる会話にも適応してます。多くのLLMは上記のような用途で利用されていますが、LaMDAはより自然な会話を生成することができます。
Google LaMDAをLLMとして搭載しているのが、Googleの対話型AIサービス「Bard」です。Bardでは、LLMの持つ知能やクリエイティビティと、世界中の膨大な知識を組み合わせた活用を目指しており、質問に対して人間の会話のような回答が可能です。
Chat GPTなど他の対話型AIモデルと同じように、質問への回答や文章生成、機械翻訳、ソースコード生成などに対応しています。ただ、BardではGoogle検索システムと連携して、最新情報を反映したリアルタイム性の高い回答を返すことができます。
2023年5月には日本語版の提供を開始しており、国内でも注目が集まっています。
「Google LaMDAと実際に会話をしてみたい」という方に向けて、Bardの使い方や注意点をまとめた下記記事もご参照ください。
Google Bardとは?ChatGPTとの違いや利用時の注意点を解説
LaMDAは人間の会話に近い自然な回答を実現していますが、まだ完全とは言えず、重大な課題も残されています。
まずは、安全性を確保した回答ができない点です。安全性はある程度はモデルのファインチューニングにより改善が見られます。微調整を重ねることで、人間と同等の品質まで精度を高めることは可能と見込まれますが、現時点では偏見や有害性のある返答を返すこともわかっています。
人々のグループに対する中傷、暴力性コンテンツを含む出力など、常識的に逸脱した回答をしてしまう可能性があります。
また、ChatGPTでも報告されている現象として、事実ではないことをそれっぽく回答してしまうことも問題です。LaMDAには、外部知識が必要な返答に対応できるかという評価指標が含まれていますが、現段階では、事実の判定能力が乏しく、特殊な専門知識や情報に関しては正確に応答できない状態です。
ただ、モデルサイズを増やすなどの対策により、知識を備えることで、一般常識に沿った回答が得られると推測されており、今後の改良や進化が期待されています。
課題が残されているLaMDAですが、自由かつ流れるような会話方法をすでに習得している点は他のLLMと比べて優位な点です。また、Googleは、LaMDAは「自然な会話に向けた大きな1歩」という認識であり、人同士のコミュニケーションに限りなく近い「マルチモーダルモデル(MUM)」にも取り組んでいると公表しています。
マルチモーダルモデル(MUM/Multitask Unified Model)は、テキストだけでなく、画像や音声、動画などさまざまな形式の情報に関する質問を、自然な形式で回答できる仕組みです。
MUMを用いることで、「日曜日にブランチができるカフェを探して」と検索をかけただけで、ブランチメニューのある近くのカフェ情報から、自宅からのアクセスや移動時間、天気予報まで一度にわかるような検索体験が実現するとされています。
Googleはいずれ検索機能でのやり取りをより自然に、より直感的な形で実現し、ユーザーの複雑なニーズに対応できることを目指しています。新しいLaMDAモデルがMUMによりどのような進化を遂げるのか、今後のアップデートから目が離せません。
LaMDAは、一時は同社のAIエンジニアから「LaMDAには感情がある」という主張が出たほど、自然な会話能力を発揮しています。今後は、Googleが提供するAIスピーカーやアシスタントなど、LaMDAが採用されたさまざまなサービスが追加されていくことでしょう。
また、LaMDAの外部提供により、企業が自社のサービスにLaMDAを組み込みやすくすることで、幅広い分野で利用される可能性もあります。2022年から続く生成系AIブームの中で、ChatGPTやBingとともに、Bardがどのように改良、進化されていくのか、今後の動向に注目しましょう。
自然言語処理について詳しく知りたい方はこちらの記事もご覧ください。
自然言語処理(NLP)とは!?AIの進化で活用広がる最新技術を紹介
AIソリューションについて詳しく知りたい方はこちらの記事もご覧ください。
AIソリューションの種類と事例を一覧に比較・紹介!
AIについて詳しく知りたい方はこちらの記事もご覧ください。
AI・人工知能とは?定義・歴史・種類・仕組みから事例まで徹底解説
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら