セマンティック検索システムで探し方改革!AIが日本語の意味を理解
最終更新日:2024/04/04
ビッグデータ時代の昨今において、情報の「見つけ方」はビジネスの成否を左右する重要な要素になりつつあります。そのデータ探しの相棒となるのは、優秀な検索システムです。今回は、AIを活用した検索システムの最前線についてまとめました。
AI検索エンジンについて詳しく知りたい方は以下の記事もご覧ください。
AIで検索エンジン機能がパワーアップ!あいまい検索の仕組みは?
係り受けや単語の意味まで理解できる AIを搭載した「セマンティック検索」
住友電工情報システムは2018年8月、全文検索・情報活用システム「QuickSolution 11」を発表しました。同システムの特徴は、AIが日本語の意味を考慮して検索する新機能「セマンティック検索」を備えている点です。
セマンティック検索は、利用者が入力した検索文の意味に合ったデータを優先して、検索上位に表示します。検索文と検索対象の双方に、同社が独自に開発したAIによる構文解析と意味解析を行うことで、こうした機能を実現しました。
そんなセマンティック検索の特徴としては、以下の3点が挙げられます。
1.セマンティック検索は主語・述語・目的語・修飾語の関係といった係り受けをふまえて検索する
例えば「日本の消費者を守る法律」という文を検索した場合、「日本の法律を守る消費者」という文でも使用されている単語は同じですが、文章の意味がまったく異なります。セマンティック検索では、AIが「消費者」を「守る」という係り受けを理解し、関連する内容を上位に表示します。
2.セマンティック検索は肯定表現と否定表現の意味をとらえて検索する
例えば「景気の影響を受けない業界」という検索文を入力したとき、AIは否定文だということを理解しているので、「影響を受ける業界」に関する内容は表示しません。
3.セマンティック検索は動詞の同義語も検索できる
「野菜を育てる」と「野菜を栽培する」は同義語であることをふまえて、検索結果を表示します。
さらに、利用者の利便性向上のため、検索にヒットした文のうち頻出する表現を「関連する表現」として表示し、利用者は別の表現でも検索が可能になります。
(参照:住友電工情報システム AIで日本語の意味を理解した検索ができる全文検索システムを販売開始~全文検索・情報活用システム「QuickSolution」にセマンティック検索を搭載~)
「セマンティック検索」と「あいまい検索」の違い
セマンティック検索と混同して捉えられがちなものとして、「あいまい検索」というものが存在します。しかし、セマンティックとあいまい検索は異なるため注意が必要です。
そもそも、あいまい検索とは何なのかというと、ドキュメント群のなかから、入力された質問文と似通っているものを検索していく技術のことを指します。あくまでも似通っている文章を検索していくわけなので、もとの質問文と完全に一致していない文章でも検索していくことができるわけです。
また、あいまい検索は、まず検索文の分解を行い、それぞれの文字列の「出現頻度」「出現集中度」「出現位置」などを考慮した上でスコア化していきます。そのため、必然的に「特定の文字列が多く含まれている文書」が高スコアとなっていくので、必ずしも意図した文書だけが上位に表示されるわけではありません。場合によっては、特定の文字列が含まれているだけの「特に関連性のない文書」が上位に表示されてしまうこともあるわけです。
一方のセマンティック検索は、あいまい検索と似た部分があるものの、構造解析や意味解析を行えるという点が大きく異なります。これらの解析を行うことによって、より検索文の意味に近いものだけを上位に表示させることができるようになるのです。
言い換えると、意味的に近くない文書や構文的に近くない文書はその検索において有用なものではないと評価され、低スコアになるということです。
(参照:住友電工情報システム株式会社 先進技術:セマンティック検索 | AIで「探し方」改革! 全文検索・情報活用システム QuickSolution)
ネット社会において欠かせないセマンティック検索
そんなセマンティック検索がもっとも身近に感じられるのは、GoogleやYahoo!といった検索エンジンでしょう。検索エンジンの極めて高い精度の検索機能は、先ほどご紹介したセマンティック検索の技術によって実現されているのです。
私たちが検索エンジンを使用する場合、必ず何かしらの「目的」が存在しています。そして、その目的を達成するための「キーワード」を入力することで、情報を得ているわけです。たとえば「東京都の観光スポットを調べる」という目的がある人の場合、おそらく「東京都 観光スポット」というキーワードで入力するでしょう。
セマンティック検索では、この検索されたキーワードからユーザーの目的や意図を理解し、そのユーザーに最適な答えを検索結果として表示させることができるのです。
「東京都 観光スポット」というキーワードの場合、おそらく大半のユーザーは、東京都の観光スポットについて紹介しているサイトを目当てにしているでしょう。ただし、先ほどご紹介したあいまい検索の場合、東京都の観光スポットでポイ捨てが増えていることを問題視する記事が上位に表示される可能性もあるわけです。
仮に、東京都の観光スポットにおけるポイ捨てにフォーカスした記事を探しているのであれば、検索キーワードに「ポイ捨て」という言葉が入るはずなので、基本的にセマンティック検索ではこのような記事は表示されません。
こういったユーザーの意図や目的まで理解できるという点が、セマンティック検索の大きな魅力といえるでしょう。
(参照:アクセス解析ツール「AIアナリスト」ブログ セマンティック検索の定義からSEOへの影響まで詳しく解説!)
検索エンジンにおけるセマンティック検索の活用事例
セマンティック検索はさまざまな分野で活用されていますが、やはり活用事例として最も身近に感じられるのはGoogleやYahoo!といった検索エンジンでしょう。そのため、ここでは検索エンジンにおけるセマンティック検索の事例をいくつかご紹介していきます。
類義語を太字で表示
検索エンジンで何かしらの検索を行ったときに、その検索キーワードの類義語が太字で表示されているのを目にしたことがある方も多いのではないでしょうか。これはまさに、セマンティック検索を通して検索したからこそ表示されているものなのです。
キーワードの類義語も太字で表示させることによって、ユーザーの意図に沿う検索結果を表示させることが可能になります。例えば、「誕生日 贈り物」というキーワードで検索した場合には、「贈り物」という単語と同じ意味を持つ言葉(キーワード)として「プレゼント」という単語も太字で表示されるわけです。
贈り物というキーワードで検索を行ったユーザーが「プレゼント」に興味を持っていないわけではないため、よりユーザーの意図に沿う検索結果を表示させる上では合理的なものといえるでしょう。
アンサーボックス
セマンティック検索を利用した自然検索では、利用したキーワードに対して「通常の検索結果」を表示させるだけでなく、「そのキーワードの答えとなるもの」を表示させることも可能です。
例えば、「2021年の建国記念の日」と入力して検索した場合、このキーワードに関連する一般的な検索結果の上(最上部)に、「2月11日(木・祝)」という答えが表示されます。こういった、何かしらの答えを求めている検索においては、その答えを分かりやすく表示させることが「ユーザーの意図を汲み取ること」につながるため、ユーザーの満足度を高めるという観点でも効果的な仕様といえるのではないでしょうか。
そして、その役割を果たすために欠かせないのが「セマンティック検索」なのです。
ナレッジグラフ
セマンティック検索は、自然検索に用いたキーワードに関するページを表示させるだけでなく、そのキーワードに関連する基本情報を表示させることも可能です。
たとえば、「中華人民共和国」というキーワードで検索を行った場合、そのキーワードを含んだページが表示されるだけでなく、中華人民共和国の地理や人口、首都といった基本的な情報が表示されます。これも、ユーザーの意図を汲み取るセマンティック検索だからこそ実現できる例といえるでしょう。
セマンティック検索は様々な産業分野、企業・団体が活用
セマンティック検索を搭載した「QuickSolution 11」は様々な産業分野、企業・団体で活用されています。
中国地方の電力供給を引き受ける中国電力では、長年蓄積された社内データと、近年構築した社内システムを横断的に検索するためのソリューションとして、「QuickSolution 11」を導入しました。
対象となるのは、グループウエアの約2TBのデータとHP系システムの約35GBのデータ。検索システムを再構築したことで、ファイル形式にとらわれず電子ファイルを一括検索できるようになったほか、さまざまな運用上の工夫もこらし、膨大な量のデータにもかかわらず検索結果の応答を得るまでの時間は5秒をキープしています。
(参照:住友電工情報システム 導入事例:中国電力株式会社様)
就業時間の約3割が情報検索に!AI活用のセマンティック検索で働き方改革
近年盛んになっている「働き方改革」の実現でも、AI、セマンティック検索による先進的な情報検索システムは切り札になると考えられます。
企業内外に膨大な情報が蓄積されるなか、昨今ホワイトカラーは「就業時間の約3割を情報検索に費やしている」とも言われます。
一方で、「複数のサーバーやフォルダに情報が分散して蓄積されており、検索が困難」「前任者からの引き継ぎ資料が十分でなく、ナレッジが継承されない」「紙文書が多すぎて情報の検索が困難」といった課題もしばしば聞かれ、情報検索が不十分であることによって、現場に混乱をもたらしている現状も見受けられます。
また、検索性の低い紙文書によるデータ共有は、ナレッジの継承を妨げます。その点、セマンティック検索を搭載したQuickSolutionは、OCR(光学認識技術)と組み合わせることで、紙文書をデータ保存し、検索対象とすることも可能です。
AIを活用したパワフルかつインテリジェンスな情報検索システムを導入することで、情報の獲得をスムーズかつ正確にし、働き方改革へと繋がっていくのです。
AIの活用事例について詳しく知りたい方は以下の記事もご覧ください。
AI・人工知能の利用例を解説!機械学習を活用した身の回りの実用例
AIについて詳しく知りたい方は以下の記事もご覧ください。
AI・人工知能とは?定義・歴史・種類・仕組みから事例まで徹底解説
- AIサービス
- 検索システム
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI・人工知能記事カテゴリ一覧
AI・人工知能サービス
- 生成AI
- 画像生成AI
- ChatGPT
- AI研究開発
- LLM
- DX推進
- おすすめAI企業
- チャットボット
- ボイスボット
- 音声認識・翻訳・通訳
- 画像認識・画像解析
- 顔認証
- AI-OCR
- 外観検査
- 異常検知・予知保全
- 自然言語処理-NLP-
- 検索システム
- 感情認識・感情解析
- AIモデル作成
- 需要予測・ダイナミックプライシング
- AI人材育成・教育
- アノテーション
- AI学習データ作成
- エッジAI
- IoT
- JDLA
- G検定
- E資格
- PoC検証
- RPAツール
- Salesforce Einstein
- Watson(ワトソン)
- Web接客ツール
- サプライチェーン
- メタバース
- AR・VR・デジタルツイン
- MI
- スマートファクトリー
- データ活用・分析
- 機械学習
- ディープラーニング
- 強化学習
- テレワーク・リモートワーク
- マーケテイングオートメーション・MAツール
- マッチング
- レコメンド
- ロボット
- 予測
- 広告・クリエイティブ
- 営業支援・インサイドセールス
- 省人化
- 議事録自動作成
- 配送ルート最適化
- 非接触AI
業態業種別AI導入活用事例
今注目のカテゴリー
AI製品・ソリューションの掲載を
希望される企業様はこちら