新型コロナウイルス対策とビジネス推進に有用な「シーケンシャル・データのモデリング」に関する考察と予測を発表

最終更新日:2024/01/19

Appierのミン・スン氏が、新型コロナウイルス対策とビジネス推進に有用な、「シーケンシャル・データのモデリング」に関する考察と予測を発表しました。

このAIニュースのポイント

シーケンシャル・データのモデリングに関する考察と予測を発表
コロナウイルスに関する研究論文を集約し分析、フェイクニュースの検出も
生物医学領域の系列データ予測にも活用

AIテクノロジー企業のAppierのチーフAIサイエンティスト、ミン・スン氏が、新型コロナウイルス対策とビジネス推進に有用な、「シーケンシャル・データのモデリング」に関する考察と予測を発表しました。
なお、シーケンシャル・データとは、連なったデータと定義し、並んでいる順番に処理することや、連続して立て続けに処理することを指します。

1．新型コロナウイルス対策に活用される「シーケンシャル・データのモデリング」

ミン・スン氏は、現在フェイクニュースの検出などで利用されている「シーケンシャル・データのモデリング」が、新型コロナウイルスの突然変異の予測、抗ウイルス薬の開発にも活用され始めていると説明しました。

新型コロナウイルス関連の研究論文は、世界中から毎日新しいものが発表されています。
日本では東京大学や理化学研究所のAIPセンターなどが発表しています。
AIがその膨大な量の研究論文を集約・分析することや、ソーシャルメディア上で新型コロナウイルスや感染症対策に関する「フェイクニュース」の検出を可能にしています。

シーケンシャル・データのモデリング　イメージ画像

生物医学領域における系列データのモデリングにより、変異を予測

「シーケンシャル・データのモデリング」は、生物医学領域の系列データ予測にも活用されています。
アミノ酸配列を文字列に置き換え、分析することで新型コロナウイルスを構成するたんぱく質の3D構造を予測することができます。

AlphaFold 2はこれを活用してタンパク質がどのような機能で、どのような役割を果たすのかなど様々な発見に役立てられています。
ハーバード大学の研究者たちは、これらと同じような技術を用いて新型コロナウイルスの突然異変を予測しています。

抗ウイルス薬の開発

アメリカの国立研究所などが開発した「IMPECCABLE」は、新型コロナウイルス感染症候補薬を評価し、創薬の工法をスクリーニングするために使われています。
これはAIとコンピュータ処理ツール、そしX線結晶学の構造解析の組み合わせによる統合モデリングパイプラインです。
このようなスクリーニングプロセスが開発される前は、1日に処理できるスクリーニングの対象の数が数百万単位でした。

しかし、AIを活用することで完全なエンドツーエンドのスクリーニングのパイプラインが開発され、1日に処理できる数が数十億となりました。
これにより、従来の手法に比べて最高5万倍の速度で化合物を評価できるようになりました。

ミン・スン氏はこの成果を「研究のポイントはエンドツーエンドのパイプラインの中にAIを導入し、そして堅牢なパイプラインを作り上げたことだ」と説明しています。

２．「シーケンシャル・データのモデリング」によるビジネスの促進

ミン・スン氏は、シーケンシャル・データのモデリングはビジネスにおいて特に「テキスト」と「音声」の2つの分野で有用だと述べています。

テキストの理解と生成

昨年、1,000億を超えるパラメーターを扱える大規模言語モデルGPT-3が注目されましたが、今年に入り、その6倍以上の兆レベルのパラメーターに対応した「Switch Transformer」が登場しました。
ミン・スン氏は、学習コストや提供コストが抑制され、今後１～３年で言語の理解や生成能力が大きく進歩すると予測します。

音声サービス発展の可能性について予測

音声データの文字起こしは、英語・中国語・日本語などのビジネスシーンで利用者が多い言語では成熟しつつあります。

一方長尺の音声においては、それ以外の言語への対応は十分とはいえず、５～10％のエラーが出てしまうのが現状です。
昨年、新型コロナウイルスによる巣ごもり需要で、長尺の音声コンテンツが人気となり、Clubhouseなどの会話型SNSがヒットし、日本での利用者が増えています。
増加している音声データをどう活用するかがビジネス上でのポイントになります。

GPT-3やSwitch Transformerなどで利用できる‶自己教師あり学習”を適用すると、入力用の音声ファイルからアノテーションなしで教師用データを抽出できます。
音声は生データのサンプリングから、音素に分解、音節を特定し、単語に結びつけていくという手間が加わります。
そのため、連続性を持った長尺の音声は、データポイントが膨大になる上、複雑な階層構造があるため、学習が難しいとされています。

ミン・スン氏はAI技術の進歩により、今後１～３年で長尺音声の文字起こしが可能になると予測します。
今後は、音声データを直接検索したり、ソーシャルチャネルでやり取りされる音声でトレンド分析することもできると言われています。

他人の声を使って成りすます音声クローンのような使い方が出てくる懸念はあるものの、リモート会議中の自分の音声を加工し、プロのアナウンサーのような美声にしたり、ものを食べている咀しゃく音をカットできる技術もまもなく利用可能になるとも予測されています。

今後の展開も、ますます目が離せなくなりそうです。

出典：PR TIMES