【インタビュー】「AI開発を10倍速く」を掲げるFastLabelのデータ改善、精度アップのポイント!
最終更新日:2024/02/07
AIを導入されても、効果が充分に発揮できていないというお悩みを持つ企業様も多くいらっしゃるのではないでしょうか。本日は、アノテーションのプラットフォームをご提供されているFastLabel株式会社、代表取締役の上田英介氏に「AI開発を10倍速くする」データ改善、精度アップのポイントを紹介いただきます。
――本日は、宜しくお願い致します。FastLabelではどんな事業を行っているのでしょうか。
――上田氏
FastLabel は、AI開発では必要不可欠なアノテーション作業のプラットフォームの提供を行っており、高品質な教師データ作成サービスを提供することで、よりAIの社会実装の促進を目指しています。
――確かにAIが使われているサービスが社会に少しずつ浸透してきていますね。アノテーションとはどんな作業なのでしょうか。
――上田氏
アノテーションとは、データに対してタグを付ける作業です。
教師あり学習のAIモデル開発において一番先に行うデータ作成の工程です。
AIはデータとアルゴリズムによって成立し、アルゴリズムがデータを学習することで人のような振舞いが可能になります。つまり、たとえ最先端のアルゴリズムであってもデータの質が低ければ思うようなパフォーマンスを発揮することができません。
私たちFastLabelは「良質な教師データでAI開発を10倍速くする」役割を担うべくアノテーションサービスを提供しています。
――「AI開発を10倍も速くする」とはすごいですね。近年のAI開発においてどのような変化があるのでしょうか。
――上田氏
2010年代に入り、革新的なディープラーニングにより第三次AIブームが到来し、飛躍的にAIの精度が向上しています。
また、従来はGoogleや、Facebook等が提供しているオープンソースのライブラリを用いてアルゴリズムを構築していましたが、最近は別の開発などで使用した学習データ済みのモデルを活用する、転移学習*¹やファインチューニング*²によるアルゴリズム開発が主流になり、よりAI開発技術が進んでいます。
*¹転移学習とは、他の開発などで用いた学習データ済みのモデルを転用することです。学習にかける時間を削減することができます。
*² ファインチューニングとは、学習済みモデルを部分的に用いて、再学習させ調整を行う手法です。
――AIの精度が上がることに伴い、データの質もより重要になりますね。FastLabelのアノテーションサービスは精度向上にどのようにアプローチされているのですか。
――上田氏
FastLabelのアノテーションサービスは「AI開発のためのAI」を使うML for ML (Machine Learning for Machine Learning) 、つまり機械学習のための機械学習を行うことで人が行っていた作業を自動化しました。
先ずは、FastLabelで蓄積したデータと独自開発のAIを活用してアノテーションを行います。AIでアノテーションを行うため、効率よく学習データを作成することが可能です。AIで正常に処理できなかったデータを人が修正をすることで良質な学習データの提供ができます。
AIと人によるアノテーションを繰り返し行うことで、AIの精度が上がっていきます。AIの精度が上がると修正が必要なエラーの数が減るため工数を大幅に効率化していくことが可能です。
――AIと人との両面で精度を向上させるのですね。良いデータ作成でAIの精度が上がるとのことですが、導入した後もしっかり運用出来るのでしょうか。
――上田氏
導入前のPoC検証だとうまく動いても、実際に導入運用になり新しいデータを入れた場合、PoCで検証した際と同じ精度を出せるケースは少ないです。
何故かというと、データにもトレンドがあるからです。
例えば、アパレル系のECサイトで、Aタイプの服を選ぶ人はCタイプの帽子も合わせて購入するなどの分析データと、それを学習したレコメンドAIがあるとします。アパレル業界はトレンドの移り変わりが早いため、短い期間で学習データの最適化を行わないと、レコメンドされた商品を購入してもらえる確率が下がってしまいます。
その為、トレンド毎にデータを最適化することが必要です。
――データにもトレンドがあるのですね。データ作成のポイントは何ですか。
――上田氏
ポイントは、質・コスト・セキュリティの3つです。
現在は、アノテーション作業をクラウドソーシング企業やBPO企業に委託する方法が中心的ですが、データ量が増えるに従い、コストは増えます。
また、沢山の方が作業に加わるクラウドソーシングですと、作業が異なる為、データ作成の品質にばらつきが出てしまい結局使い物にならず、また委託側の人たちが作業を修正行う羽目になってしまうことがあります。
セキュリティでは、アノテーション作業時にデータを預けますが、不特定多数の作業者にデータが開示されるという不安を抱える企業様がいらっしゃいます。
――とても大事なポイントですね。FastLabelでは、ポイントにどのようにアプローチしているのでしょうか。
――上田氏
はい、ポイントにつきましては事例と一緒にお話させて頂きます。
最近大手の製造業のお客様から、画像判定の精度が上がらないと、ご相談をいただきました。お客様は半年から1年の期間をかけて、導入済の画像判定の精度を上げたいというテーマを自社で取り組まれていましたが、精度が上がらないという課題がありました。FastLabelにご依頼いただいたところ、データセントリックなアプローチでデータの特徴や質、量を1週間サイクルで改善・確認し直すことで、1ヵ月で精度を40%改善することができました。
ご依頼をいただく前は50%程度の精度を短期間で90%まで引き上げるなど、スピーディーかつレベルの高い技術を提供できるというのが弊社の強みです。
さらに、アノテーションの進捗や各作業者ごとのパフォーマンスをダッシュボード上で確認することができ、進捗管理やデータ管理ができるので、管理工数の削減に繋がります。
また、FastLabelのプラットフォームがあるので、データとノウハウを蓄積され、お客さんが増えれば増えるほど、アノテーションの精度が上がります。製造業において重要なQCD*³の向上を実現し、より良いサービスをご提供できます。
*³ QCDとは、品質・コスト・納期(Quality・Cost・Delivery)頭文字で、製造業では欠かせない要素です。
――1ヶ月で質もコストも改善可能なのは現場の方も喜ばれますね。セキュリティについては、どのように対策されているのでしょうか。
――上田氏
はい、やはり大事なデータを大量に預けるのは企業様としてもリスクが高く不安に思う企業様が多いと思います。
FastLabelでは、アノテーションセンターを福岡に開設をしており、国際情勢に左右されないのも大きなポイントです。さらに、情報の機密性や完全性、可用性を保ち、セキュリティシステム運用を行い、ISMS*⁴の認証を昨年12月に取得しました。システム情報セキュリティ体制の構築し、ご安心いただき大切なデータを取り扱いさせて頂く環境を整えました。
*⁴ ISMSとは、情報セキュリティ管理システムの略です。企業における情報セキュリティを管理する仕組みです。
――なるほど、データを預ける事に不安な企業様も安心して預けることができますね。ちなみに事例でおっしゃっていましたデータセントリックなアプローチとは何を指すのでしょうか。
――上田氏
データセントリックな手法とは、アルゴリズムは変えずに、データを改善していくという思想です。例えば、物体検出の精度が思うように出ない場合、AIが判断を間違っている対象物を判別させるためのクラスを追加したり、アノテーションルールを精緻化した上で、再度アノテーションを実施し、そのデータを再学習させるといったようなことで大幅に精度が向上するケースが多々あります。
また、作業者ごとの品質のばらつきをなくすというのも有効な手段です。FastLabelでは、品質のばらつきをなくすために、オンボーディング(事前テスト)という仕組みを構築しています。新しく作業に加わるスタッフへテストを実施し、基準点を合格した人だけがアノテーション作業を開始することができます。このテストを行うことでデータ作成を同じ水準を保つことが出来るようにしています。
このようなデータセントリックなアプローチでFastLabelはアノテーションを迅速に高品質のデータ作成を可能にしています。
――アルゴリズムではなく、データ改善に指標を置いたアプローチですね。従来の方法と何が違うのでしょうか。
――上田氏
従来のアルゴリズムを変えて精度を上げていくモデルセントリックと言う手法ですと、大量のデータが必要になると共に、エンジニアが都度手動で改善を行う必要があるため、AIエンジニアが3ヶ月~6ヶ月の時間をかけて改善をしないといけません。
その半年間、AIの精度が低いまま使い続けるのは、あまり実用的ではないですよね。
――なるほど、従来とは劇的に速く改善が可能とは素晴らしいですね。FastLabelの今後のビジョンを教えてください。
――上田氏
アノテーションは一見単純な作業と思われがちですが、弊社では、ソフトウェアにおける「次世代のコーディング」だと考えています。アノテーションをすることで、AIが学習し、その精度を評価することで新たなデータを作り出していく。このようなサイクルを自動化できる未来を目指しています。
ソフトウェア開発ですと、どうしてもエンジニアリングの知識のある人でないと、ソフトウェアは作れないですが、AI開発の領域ですとアノテーション作業はシステム開発やAIの知識は不要で、ドメイン知識があれば出来る作業です。AI開発に参加できる人の制限がなくなっていくので、今後AI開発が速度的に発展していき、AIプロダクトが今後10年で増えると考えています。
弊社は専門家や、ドメイン知識のある方、また非専門家でもAI参加できるような基盤を提供していくような企業を志しています。
ビジョンとして「AI革命のインフラになる」を掲げて、誰もがAI開発に参加できる基盤を作ります。
AIを導入しても、上手くいかないなどの課題がある企業様は是非、一度ご相談ください!
――ありがとうございます。素敵なビジョンですね!現在行われているキャンペーンについても教えてください。
――上田氏
はい、現在FastLabelでは、「アノテーション10万円無料キャンペーン!」を行っております。
ご案内させていただいた通り、品質の良いデータ作成や、データ収集、データ生成も可能です。
ぜひ、キャンペーンをご活用ください!
――本日は貴重なお話をありがとうございました。誰もがAI開発参加できるプラットフォームの実現がとても楽しみです。
今回のお話で、データ作成の重要性を教えて頂きました。データにもトレンドがあり、常にデータを最適化することでAI導入後の運用も進みますね。データの判定率などにお困りの企業様や、データ作成をしたいが、どうしたらいいか悩まれている企業様はぜひ、FastLabel様へご相談ください。
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI・人工知能記事カテゴリ一覧
AI・人工知能サービス
- 生成AI
- 画像生成AI
- ChatGPT
- AI研究開発
- LLM
- DX推進
- おすすめAI企業
- チャットボット
- ボイスボット
- 音声認識・翻訳・通訳
- 画像認識・画像解析
- 顔認証
- AI-OCR
- 外観検査
- 異常検知・予知保全
- 自然言語処理-NLP-
- 検索システム
- 感情認識・感情解析
- AIモデル作成
- 需要予測・ダイナミックプライシング
- AI人材育成・教育
- アノテーション
- AI学習データ作成
- エッジAI
- IoT
- JDLA
- G検定
- E資格
- PoC検証
- RPAツール
- Salesforce Einstein
- Watson(ワトソン)
- Web接客ツール
- サプライチェーン
- メタバース
- AR・VR・デジタルツイン
- MI
- スマートファクトリー
- データ活用・分析
- 機械学習
- ディープラーニング
- 強化学習
- テレワーク・リモートワーク
- マーケテイングオートメーション・MAツール
- マッチング
- レコメンド
- ロボット
- 予測
- 広告・クリエイティブ
- 営業支援・インサイドセールス
- 省人化
- 議事録自動作成
- 配送ルート最適化
- 非接触AI
業態業種別AI導入活用事例
今注目のカテゴリー
AI製品・ソリューションの掲載を
希望される企業様はこちら