生成AI

最終更新日:2024/04/04
最近、OCR(光学文字認識)技術の中でも「手書き文字」の認識が可能なAI-OCRに注目が集まっています。文字認識率9割以上をうたうソフトウェアも登場しており、手書き文書を扱う各種事務作業の効率化が図られています。
リクルートマーケティングパートナーズは2017年より、同社が提供するオンライン学習サービス『スタディサプリ』の講義動画内の音声や文字データを検索し、動画の「見たい」「聞きたい」部分をすぐに再生できる機能を提供しています。
テキストマイニングや深層学習(ディープラーニング)を用いた解析技術によって、先生の声(音声データ)や黒板の手書き文字をテキスト化して認識。ユーザーが見たい部分の検索を容易にしました。
動画内テキスト検索機能は、講義動画内の「黒板の文字」のキーワード検索が可能です。文字認識技術のディープラーニングによって、講義中の黒板の手書き文字をAIが自動で認識します。そしてそれをテキストデータ化することにより、自由で簡単なキーワード検索の実現を目指すというものです。
手書き文字を認識するだけでなく、手書き文字を自ら書くロボットも登場しています。
研究しているのは、米国ブラウン大学の小谷篤信さんのチームです。このロボットは、日本語の学習を通じて得た知識を応用し、ヒンディー語、ギリシャ語、英語といったロボットにとって初見の言語も手書きできる能力を身に付けました。
手書きの文字は、書き方や書き順など細かいアルゴリズムで成り立っています。私たち人間が子どもの頃に文字を書く訓練をしたときも、正しい書き順に沿って書かないと、どこかバランスの悪い文字になったものです。
小谷さんらの開発したロボットは黒板の手書き文字を見て、書き始めはどこか、書き順はどうなっているかなどをマシンビジョンで判断し、つぎつぎと正しい方向にペンを走らせていきます。研究チームが試しに、ヒンディー語、タミル語、イディッシュ語の異なる筆跡でそれぞれ「こんにちは」と書き、ロボットを混乱させてみました。すると、ロボットは混乱するどころか、日本語を書く訓練しか受けていないのにも関わらず、アルゴリズムを理解して自力で書き写してみせたのです。英語に関しては、楷書だけでなく筆記体も書くことができます。
いまや、ロボットの手書き文字は人間とそん色ないほどに上達したそうです。ロボットの「手書き」は、人間との新たなコミュニケーション手段になるかもしれませんね。
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら