RAGデータ作成ツール
RAGデータ作成ツール
ソフトバンク株式会社-よろしくお願いいたします。まず簡単に御社の事業内容についてお聞かせください。
テレビ局の業務システム、基幹システムの開発・運用や、コンテンツの作成をしています。テレビ画面に映されるテロップ(字幕)をつけるなど、間接的に番組制作にも携わっています。
-これまで川島様が携わったお仕事について教えてください。
新卒の頃、テレビ関係の仕事はやっていなかったんです。最初はJH(日本道路公団)様のウェブサイトや、カメラ・フィルム関連企業様のオンラインプリント開発に携わっていました。その後色々なシステム開発、WEB開発を経て、ようやくテレビの基幹システム開発に戻ってきました。うちの会社には、テレビに関わるシステムに興味があって入ってくる人が多いのですが、実は私はあまり興味がなく、ミーハーだったので、バラエティーやドラマ、スポーツ番組を作ることに興味があったんですよね。テレビに出られると思ったのですが、そんなことはなかったですね(笑)。
-AIとはどのように接点を持ったのでしょうか。
2015年にその当時あった社長室企画部に兼務でジョインしました。今までやっていないことを色々やってみようという感じで、当時は画像認識やディープラーニングが研究施設だけではなく、企業でもできるようになってきた時代でした。テレビでの画像分類をやってみたり、日本IBM様のユーザー研究会に所属していたので、そこでは複数の単語を入れるだけでメール文が作れるという論文を書いたりと、今でいう自然言語処理的なテクノロジーですね。当時はまだ自然言語そのものを扱うのはまだまだこれからだという認識でした。
-本業のテレビ関係のシステムとAIが徐々に絡み合っていったのですね。
テレビ局では私のように一人で多種多様な面白いことにチャレンジしている方が多いように感じていました。たまたま年末の納会でテレビ局の方と話している時に、番組の出演者の顔認識と出演時間をディープラーニングで解析・可視化したいという人がいて、2019年頃からテレビ局の方とAIに関する連携とPoCによるプロトタイプ開発が始まりました。
-弊社のサービス「harBest」との出会いですが、3月の「AI博覧会」でしょうか。
そうですね。2023年の秋頃、社内で生成AI活用プロジェクトが始まりました。その立ち上げメンバーに選んでいただいて、AI開発を進めていく中での課題を計画書にまとめているところでした。
AI博覧会の日は、ちょうど客先に向かう途中に気分転換でふらっと寄ってみました。「AIで何かしら形になる成果や結果を残したい」とずっと思っていたこともあり、1時間ぐらい見ようと思って立ち寄りました。しかし、会場に入ったら大変混雑していて。早く出ないと、次のお客さんとの打ち合わせにも間に合わないし。お昼ご飯も食べられないし…と急いでいた時にばったり出会ってしまったんですよね(笑)。
-最後の最後で、私たちのブースにお立ち寄りいただいたのですね。
まんまと捕まってしまいまして、気付いたら20~30分程話し込んでいました。その結果、お昼ご飯食べる時間は無くなってしまいましたが(笑)。
-その時、今回受賞されたプロジェクトの話をされていたように記憶しておりますが、何かAI開発にかかわるデータを探されていたのでしょうか。
自分で画像データを探すにしても、何が必要なのかというのもイマイチよくわかりませんでしたし、正直「精度上がらないでしょ」と諦めていたのです。場所を選定して、自分で撮影して、自分で切り出して、と一つ一つやらないと精度上がらないだろうなと思っていました。大変だからまず(APTO様で)入手してから考えるのもアリかと。で、実際に購入して、モデルを作って、実際の道路で撮影して推論させてみたのです。そうしたら「ひび(クラック)」や「穴(ポットホール)」もちゃんと検知してくれたので調子づいちゃいました(笑)。
-実際に「ポットホールのデータセット」を使ってみていかがでしたか。
PoCやコンテストに出すとなると、正常なデータも必要となり、そちらは後から自分で画像を集めました。本件に関しては、色々と教えていただいたことで、あれもこれもデータセットになるのだという気づきをもらいましたね。
その後は家の近くの新しくできたコインパーキングで、綺麗なアスファルトの画像データ収集なんかもしました。データ収集中は「怪しい変なおじさん」になっていましたが、「データセットはこういう感じでいいのだ」という新たな発見とアイデアをもらえて面白かったですね。今更かもしれませんが、悩むより行動することが大切ということが身に染みました。
-弊社とのコミュニケーションはいかがでしたか。
私自身そんなデータのことについてよくわかっていなかったので、「データの形式は何がいいですか?」と聞かれても、正直何でもいいのだけど、とか思っていたのですけど、色々と気軽に対応してもらえてすごく助かりました。今後アノテーションについても時間があれば試してみたいです。
-また、新たなプロジェクトに挑まれると伺いました。お聞かせ願える範囲で教えていただけませんか。
今、LLMファインチューニングするためのインストラクションデータに大変興味があります。生成AIのすごいところは、コンテンツを一つひとつ手作りしなくても簡単に作れるところですよね。それを使って、AIによる実況や裏話が聞けるコンテンツを作りたいです。そうしたらエンタメコンテンツの楽しみ方に幅が出てくるなと思っておりまして。
-是非、お力添えさせてください。本日はたくさんのお話を聞かせていただきありがとうございました。私たちもアップデートを重ねて参りますので、引き続き「harBest」をよろしくお願いいたします!
株式会社フジミック 様が導入したサービス
「harBest for Data」をもっと知りたい方は
無料資料請求
こちらのフォームにお客様情報を入力後に製品の資料を送付させていただきます。
業務の課題解決に繋がる最新DX・AI関連情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
実際のメールマガジン内容はこちらをご覧ください。