【Vol.6】心音、声、産業音…あらゆる音をデータ化し異常を予測できる未来。20年のエンジニア経験を元に、「音」×「AI」の難題に挑む。
2022.06.17
Hmcomm株式会社
このインタビューの要点
・産総研発のベンチャー企業として音声認識技術を開発、ソリューションへの転換へ
・異音検知と疾病検知の実用化に取り組む
・誰もができないことを実現できる「音のスペシャリスト集団」として、難易度の高い「音」×「AI」領域で存在価値を高め続ける
AIによって様々な技術が進化しつつある現代において、AIによる「音のデータ化」というビジネスを掲げたHmcomm。20年間のソフトウェア会社勤務を経て培った知見から、起業し、国立研究開発法人産業技術総合研究所(以下、産総研)発のベンチャー企業として、様々なアイデアを生み出しています。産業から医療、インフラまで幅広く応用の利く音の技術を研究する、Hmcomm株式会社代表取締役CEO三本幸司氏に話を伺いました。
音✖AI事業開発の引き金となったフィリピンでの経験
NTTPC
Hmcommは、産総研との関わりが、今の音事業の始まりだったと伺いました。産総研との関わりについてお伺いできますか?
三本
当社は、つくばに本拠を置く産総研発のベンチャー企業として独自の音声認識技術を研究・事業化しています。元々は、産総研で「音」について研究した成果を社会に実装していくということを目指してスタートしました。
起業前は、富士ソフトという企業に20年余り勤めていたのですが、会社を飛び出してから色々なプロジェクトに関わる中で「音」に注目し、研究を深めたいと考えて、産総研の門を叩きました。
NTTPC
AI業界においては、画像認識の分野はかなりの会社が活躍されていますが、音の領域はまだまだこれから開拓の余地があるように思います。三本さんにとって「音」ビジネスに取り組んだきっかけや魅力を教えていただけますか?
三本
最初のきっかけはフィリピンのコールセンターを視察したときの経験です。色々な大学やオフショアの会社へ視察に行きました。フィリピンの経済の中心で数多くの高層ビルが数多く立ち並ぶマカティという都市があります。そこの視察先で高層ビル一棟すべてがコールセンターになっているところがありました。欧米からたくさんの仕事を受託しているようで、注意して見ていると、そのコールセンターのスタッフは電話を聞きながら同時に忙しく書き起こしをしていました。「会話履歴を文字にすると、そこからいろいろな価値が生まれるんだ」と現地のスタッフに説明を受けて、「そういえば日本のコールセンターはどうなっているのだろう」と気になり始めました。
人間が書き起こすのではなく、音声認識技術を使えばビジネスになるんじゃないかなと。
起業した当時は、GoogleやAmazonなどの汎用音声認識エンジンの精度が少しずつあがり始めた状況でした。ヒューマノイドロボットなどに実装されたり、AIスピーカーなどの製品が出始め、急速に個人向けの音声認識を搭載したサービスや製品が出てきていました。
「音声認識を民主化するんだ!」と意気込んでみたもののビジネスの場で「音」を扱うのは簡単ではないことに気がつきました。
まず始めにセキュリティの課題があります。次に肝心な認識精度においても、汎用音声認識エンジンではまだまだ課題が残る状態でした。
例えば、会議室や電話の会話における音声データ活用や、音声での報告書の入力など、雑音耐性が悪かったり、専門用語をチューニングする仕組みがないなど、あまり実用的ではありませんでした。しかし、他がやれていないからこそ、我々が手がける大きな価値があるんじゃないかと考え産総研の研究成果をブラッシュアップして実用化する道を選択しました。
※これより先は外部のウェブサイトに移動します
【Vol.5】宇宙物理からAIへ。産学両眼でギャラクシーズが見据える、新時代への転換点とは。
【Vol.7】膨大なデータとノウハウを基にスタートアップが新たな価値を共創するSupership。既存の枠にとらわれない発想がイノベーションへとつながる。
PARTNERS
これより先は、外部のウェブサイトに移動します。