セマンティック検索とは?最新検索エンジンの仕組みをわかりやすく解説
最終更新日:2024/03/04
GoogleのテレビCMをご覧になった方も多いでしょう。
「この近くにあるいい感じのカフェ」――こんなあいまいなオーダーも、Google検索におまかせ。
Googleマップから「いい感じのカフェ」を選び出し、店舗や料理の写真、地図、位置情報を表示してくれます。あなたはその中から、今の気分に合ったもっともいい感じのカフェを選ぶだけでOK。
こんなあいまいなWeb検索を可能にしたのは、AI・人工知能です。
AIの活用事例について詳しく知りたい方は以下の記事もご覧ください。
AI・人工知能の利用例を解説!機械学習を活用した身の回りの実用例
セマンティック検索とは何か
「セマンティック検索」とは、「あいまいな検索」を表します。検索キーワードを始めとする入力情報から、検索ユーザーの意図・目的を読み取り、ユーザーが求める検索結果を提示するという概念、またその技術です。
セマンティックとは
セマンティック(semantic)とは、英語で「意味の」「語義の」といった意味を指す単語です。IT業界では、「データが持つ意味をコンピューターに理解させて、処理する技術」という意味で多く用いられる傾向にあります。
基本的に「セマンティック」という言葉が単体で用いられることはありません。セマンティックは、「意味の、語義の、意味的な」などと訳される形容詞だからです。そのため、セマンティック〇〇といった形で、何かしらの言葉に紐づいて意味をなします。
検索クエリの意図を理解
セマンティック検索が活用されている例の代表格として挙げられるのは、やはりGoogleでしょう。Googleがセマンティック検索を導入した背景としては、検索クエリの多様化とAI技術の発展が考えられます。この検索クエリとは、検索エンジンでユーザーが入力する単語、文章などを指します。近年はスマートフォンが普及したことにより、多くのユーザーが手軽にインターネットで情報収集を行えるようになりました。その結果、検索クエリも多様化し始めているわけです。
そして、検索クエリが多様化したことにより、Google側としてはユーザーニーズを満たすための施策を講じる必要性が高まりました。そのために必要なのは、検索エンジンの性能を高めることであり、そこで活用されたのがAI技術だったのです。そのAI技術の活用によって、より先進的な「セマンティックウェブ(Web)」というものが活用されるようになりました。
意図に合わせた検索結果を表示
セマンティック検索の上位概念として存在するのが、「セマンティックウェブ(Web)」というものです。これは、Webサイトを単なる文字列ではなく、背景や文脈を持つものとしてとらえるというもの。Webサイトの意味をとらえることで、その内容を検索結果に反映させることができるのです。
例えば、「飲み屋」と入力すると、「居酒屋」や「バー」も含んだ検索結果を表示させることができます。
これにより、ユーザーが本来意図しているものを適切に汲み取り、より最適なコンテンツを検索結果の上位に表示させられるようになったわけです。また、Googleの場合は「リッチスニペット」「強調スニペット」「アンサーボックス」「ナレッジグラフ」などを表示させることで、より確実にニーズに応えられるようにしています。
当然、Googleとしては顧客満足度の向上を図る上で「ユーザーニーズを満たせるコンテンツの提供」は欠かせません。そのため、意図に合わせた検索結果を表示できる「セマンティックウェブ(Web)」には大きな価値があるのです。
言葉の表現の揺らぎにも対応
Google検索では、単語ではなく文章が入力されるケースも少なくありません。そのため、同じ意図を持つユーザー同士でも、検索クエリが少しずつ異なる可能性があるわけです。しかし、セマンティック検索はそういった言葉の表現の揺らぎにも対応しており、ユーザーの意図を汲み取った上で検索結果を表示できます。
また、Googleと同じく検索エンジン大手のYahoo!では、ちょっとした誤字であれば「○○も含めた結果を表示しています」といった形で、ユーザーの意図する語句を汲み取ってコンテンツを表示させているため、ユーザーは再検索する手間を省くことが可能です。
セマンティック検索とあいまい検索の違い
セマンティック検索と混同されがちなものとして、あいまい検索が挙げられます。このあいまい検索とは、データ群を検索していく際に、検索クエリと類似するデータを検索していく技術を指します。あいまい検索は、検索クエリを分解することによって、文字列が出現する頻度・集中度・位置などを分析および評価し、検索結果を表示していきます。
但し、この方法では、検索クエリの文字列をたくさん含んでいるだけで評価が高くなってしまうため、Googleにとって適切なアルゴリズムとはいえません。検索クエリの文字をたくさん含んでいるコンテンツが、必ずしもユーザーの検索意図に沿ったコンテンツとは限らないからです。
そのため、Googleではセマンティック検索が重要視されるようになりました。セマンティック検索は、検索クエリの意味を理解した上で、検索結果を表示させることが可能です。ただ、検索クエリの出現頻度が高いコンテンツを上位に表示させるのではなく、意味や文脈も含めて情報の有用性を判断していくため、よりユーザーの検索意図に答えられるコンテンツを上位に表示させられるのです。
あいまい検索の処理フロー
そんなあいまい検索ですが、GoogleのRankBrainに関しては具体的な仕組みが公表されているわけではありません。ただ、Google以外にもあいまい検索の技術を提供している企業は数多く存在するため、それらの企業の技術を参考にしてみると良いでしょう。
例えば住友電工システムでは、あいまい検索の処理の流れとして、以下の2ステップが存在しています。1つ目が「文字部分列の選別」、そして2つ目が「スコア算出」です。
文字部分列の選別
検索した文章の出現頻度をもとにして、検索に有効な文字部分列を選別していきます。検索の精度を維持しながら検索処理を行うことができ、文章が少し長文であっても問題なく選別を行えるのが特徴です。
スコア算出
部分文字列の出現頻度や出現集中度などを踏まえた上でスコア化します。例えば、部分文字列の出現するドキュメントが少ない場合には、出現頻度が低いためスコアが高くなるわけです。さらに同じドキュメント内で部分文字列が何度も出現する場合にもスコアが高くなります。そのため、コールセンターのFAQ検索や類似問い合わせの検索などに活用されているそうです。
(参照:住友電工情報システム株式会社 先進技術:あいまい検索(類似検索))
GoogleはBERTやPaLMなど言語モデルを日々進化中
Googleでは、ユーザーの満足度を高めるために、定期的に検索アルゴリズムのアップデートを行っています。よりユーザーにとって最適なコンテンツを表示させられるアルゴリズムこそ、Googleのブランド力向上にも繋がっていくからです。
近年のGoogleの流れとしては、2015年頃にRankBrain(ランクブレイン)というAIベースの検索アルゴリズムが導入されました。例えば、「アメリカ 総理大臣」と誤った検索をしても、アメリカの大統領であるジョー・バイデン(2023年時点)が表示されます。これはまさに、RankBrainによって実現できるようになったことのひとつです。
また、2019年10月には、BERT(バート)というAIベースによる自然言語処理の検索アルゴリズムが導入されました。日本で導入されたのは2019年12月頃であり、検索キーワードのゆらぎ(ニュアンスの違い)や文脈などを判断する技術が格段に向上したことで、よりユーザーの意図を的確に汲み取れるようになったのです。
さらに2022年には、PaLMという検索アルゴリズムが導入され、できることの幅がより一層広がっていきました。因果関係、常識の理解などを必要とする難解なタスクでも、的確に解けるようになったのです。また、入出力の例を示す際において思考過程を含めることによって、これまで解くことのできなかった問題でも解けるようになったことが報告されました。より人間らしい挙動であることから、大きな注目が寄せられています。
自社専用の検索エンジンでアクセシビリティを向上
今回は、ユーザーの満足度にも大きな影響を及ぼす「セマンティック検索」についてご紹介しました。
セマンティック検索を活用している代表例ともいえるGoogleでは、セマンティック検索の活用によって大幅なアップデートを実現できていることがお分かりいただけたのではないでしょうか。そんなセマンティック検索は、自社専用の検索エンジンに活用していくことも可能です。アクセシビリティを高めることで、企業に蓄積された知識やノウハウをより効果的に共有できるようになります。そのナレッジマネジメントは、企業の成長にも大きな影響を及ぼすポイントといえるでしょう。
アイスマイリーでは、検索システムの利用料金・初期費用・無料プラン・トライアルの有無などを一覧で比較・確認できる資料を無料配布しております。課題や目的をヒアリングした上で、最適なサービスを提案させていただくことも可能ですので、検索システムの導入をご検討の際はぜひお気軽にお問い合わせください。
AIについて詳しく知りたい方は以下の記事もご覧ください。
AI・人工知能とは?定義・歴史・種類・仕組みから事例まで徹底解説
- AIサービス
- 検索システム
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI・人工知能記事カテゴリ一覧
AI・人工知能サービス
- 生成AI
- 画像生成AI
- ChatGPT
- AI研究開発
- LLM
- DX推進
- おすすめAI企業
- チャットボット
- ボイスボット
- 音声認識・翻訳・通訳
- 画像認識・画像解析
- 顔認証
- AI-OCR
- 外観検査
- 異常検知・予知保全
- 自然言語処理-NLP-
- 検索システム
- 感情認識・感情解析
- AIモデル作成
- 需要予測・ダイナミックプライシング
- AI人材育成・教育
- アノテーション
- AI学習データ作成
- エッジAI
- IoT
- JDLA
- G検定
- E資格
- PoC検証
- RPAツール
- Salesforce Einstein
- Watson(ワトソン)
- Web接客ツール
- サプライチェーン
- メタバース
- AR・VR・デジタルツイン
- MI
- スマートファクトリー
- データ活用・分析
- 機械学習
- ディープラーニング
- 強化学習
- テレワーク・リモートワーク
- マーケテイングオートメーション・MAツール
- マッチング
- レコメンド
- ロボット
- 予測
- 広告・クリエイティブ
- 営業支援・インサイドセールス
- 省人化
- 議事録自動作成
- 配送ルート最適化
- 非接触AI
業態業種別AI導入活用事例
今注目のカテゴリー
AI製品・ソリューションの掲載を
希望される企業様はこちら