生成AI

AIエージェント
生成AI
ChatGPT連携サービス
AI受託開発
対話型AI -Conversational AI-
ボイスボット
バーチャルヒューマン
教師データ作成
AI研究開発
通訳・翻訳
声紋認証
機密情報共有・管理
契約書管理システム
ワークステーション
FAQシステム
AIカメラ
生体認証
インボイス制度対応システム
データセットの収集・購入
コールセンター
人事・総務向け
インバウンド対策
コンバージョンアップ
KYT・危険予知で労働災害防止
無料AI活用
顧客リスト自動生成
ロボットで自動化
LINE連携
セキュリティー強化
テレワーク導入
AI学習データ作成
配送ルート最適化
非接触AI
受付をAIで自動化、効率化
AIリテラシーの向上サービス
日本語の手書き文字対応AI-OCR
Windows作業の自動化RPAツール
リスク分析AIで与信管理
紙帳票仕分けAI-OCRサービス
サプライチェーン
AIコンサルティング
最終更新日:2024/01/18
セグメンテーションとAI開発
デジタル技術の進化と浸透とともに、ディープラーニングを用いたセグメンテーション(Segmentation)が注目を集めています。中でも、セマンティックセグメンテーションは、画像や映像と相性が良く、多くのサービス開発や活用が進められている技術です。
この記事では、セマンティックセグメンテーションの意味や、他のセグメンテーションとの違いについて解説します。AI開発におけるセグメーテーションの種類と活用事例も紹介するので、AIサービスの開発や画像領域における研究・開発に興味がある人はぜひご覧ください。
画像認識について詳しく知りたい方は以下の記事もご覧ください。
画像認識とは?AIを使った仕組みや最新の活用事例を紹介
セグメンテーション(Segmentation)とは、日本語の「分割」という意味があり、機械学習において画像を複数のオブジェクトに分割する技術のことです。
コンピュータを使って画像からさまざまな情報を自動抽出することを目的とした画像認識は、「画像分類」「物体検出」「画像セグメンテーション」という3つに大別されます。
画像分類(クラシフィケーション)では、画像が何かをカテゴリーやクラスに分類する方法です。物体検出(ディテクション)は、画像内の物体の位置や種類、個数の特定を行います。画像セグメンテーションは、画像の被写体を識別する技術です。
セグメンテーションを含む画像認識関連のテクノロジーは、近年急速に発展を遂げており、すでに自動運転や顔認識といったシーンで採用されています。AIが得意とするデータ蓄積や分析と、セグメンテーションの組み合わせによるさらなる発展が期待できるでしょう。
セグメンテーションにおける高い精度を実現するためには、正確なアノテーション(Annotation)が必要です。アノテーションとは、テキストや音声、動画といった異なるデータに、ラベルやタグを付ける作業を指します。特定の情報に対してメタデータと呼ばれる情報タグを付けることで、AIによる物体の認識・識別が可能です。
アノテーションによってラベル付けされた情報は、AIの機械学習アルゴリズムに取り込まれることで、初めてパターン認識ができます。逆にラベル付けが正確でないデータがあっても、AIが正しく学習できないためデータ処理が進みません。
以上の通り、アノテーションは予測精度の高いセグメンテーションを行う上で必須の技術です。ただ、セグメンテーションだけでなくアノテーションは難易度の高い技術であり、独自のプロセスやリソースを保有する専用企業へ相談、依頼する必要があるでしょう。
アノテーションサービスを選ぶ上で欠かせない情報をまとめたPDF資料を、下記より無料ダウンロードいただけます。アノテーションやAIサービスの検討にぜひご活用ください。

セグメンテーションには大きく分けて3つの種類があります。それぞれの種類について、特徴や活用事例を詳しく見ていきましょう。
セマンティック・セグメンテーション(Semantic Segmentation)は領域分類とも呼ばれ、画像のピクセル(画素)1つひとつに対してラベル付けしていく手法です。画像全体や画像の一部の検出ではなく、ピクセル(画素)単位で被写体などのタグ付けやカテゴリ分けを行います。
物体が重なっていると各々の区別は難しいものの、空や道路など不定形の領域を検出可能です。自動運転車や個人のスマホ、製造工場や医療現場まで現代の幅広いシーンにおいて、被写体を識別してメリットを得る作業に活用されています。
インスタンスセグメンテーション(Instance Segmentation)とは、画像の中にある物体の領域を特定した後で個体ごとに領域分割し、物体の種類を認識する手法です。物体ごとの領域分割と、物体の種類の認識の両方を実行します。
不定形の領域は不向きですが、セマンティックセグメンテーションが苦手とする隣接した物体を区別可能です。
パノプティックセグメンテーション(Panoptic Segmentation)とは、セマンティックセグメンテーションとインスタンスセグメンテーションを組み合わせた方法です。画像内のすべてのピクセルにタグが付けられ、カウントできる物体として個別認識した結果が返されます。
既存の方法では、別々のプロセスで処理されてから1つに統合するものが多く、それぞれがうまく噛み合わない場合に相互作用が生じるケースがありました。パノプティックセグメンテーションでは、2つのセグメンテーションが持つ長所をつなぎ合わせることで、スムーズに画像認識が可能です。現時点ではまだ開発途中の段階にあり、今後の発展と活用が注目されています。

セグメンテーションの主なアプローチ・技法について詳しく解説します。セグメンテーションの代表的なアプローチは5種類あり、複数を組み合わせて利用することも可能です。
FCN(Fully Convolutional Network)とは、日本語で全層畳み込みネットワークと呼ばれ、セマンティックセグメンテーションに使われる手法です。多くの層を持つニューラルネットワークの「CNN(畳み込みニューラルネットワーク)」の1つに分類されます。
CNNは、特徴的な機能を持つ層で構成される順伝播型ニューラルネットワークが直接データを学習できる仕組みです。人の手による抽出が不要で、特に画像認識分野における深層学習において注目を集めています。
FCNは、全結合層を領域全体をカバーする畳み込み層で置き換えたものです。画像の中の物体や顔、背景を認識し、パターンを見つける用途に有効で、自動運転車や顔認識アプリなどに使用されています。
SegNetとは、イギリスのケンブリッジ大学が提唱したセマンティックセグメンテーション手法です。入力画像から畳み込み層によって特徴を抽出するEncoder(エンコーダ)と、抽出した特徴を元画像のピクセル位置との対応関係としてマッピングするDecoder(デコーダ)で構成されています。
エンコーダ抽出によって抽象的になってしまった部分を、デコーダが高解像度な画像を再構築する仕組みです。道路画像の画素単位の画像分割などに利用されています。
FPN(Feature Pyramid Networks)とは、画像データから抽出された特徴をピラミッド型に伝播させる手法です。日本語では、特徴ピラミッドネットワークと呼ばれます。
画像認識において、サイズが小さいと検出精度が下がりやすい、という課題を解消するために開発されました。FPNを使うと、従来のように異なる画像倍率での分析や結合が省けるため、画像認識の効率化や検出精度の向上に役立ちます。
R-CNN(Region-Convolutional Neural Network)は、インスタンスセグメンテーションなどに応用されている物体検出用に考案されたモデルです。画像から物体が存在する領域の候補を抽出し、物体を囲む長方形の枠(バウンディングボックス)とクラスを予測します。
代表的なモデルである「Mask R-CNN」では、バウンディングボックスにおけるピクセルごとのクラスまで予測可能です。
RNN(Recurrent Neural Network)は、時系列や文章などの連続的な情報を持つデータに適した手法です。日本語では、再帰(回帰)型ニューラルネットワークと呼ばれます。画像データでは、画像の垂直方向や水平方向の連続性をモデル化することが可能です。
RNNの「Reccurent」は、「回帰」や「再帰」という意味を持ちます。RNNは、過去に計算された情報を覚える記憶力が備わっており、直前の情報に影響されず特定の言葉を覚えながら作業することが可能です。

セグメンテーションによって実現可能な技術とその活用事例を紹介します。セグメンテーションは専門性の高い技術ですが、IoTやDXの浸透に伴い、社会的なニーズが高まっていることは事実です。ここで紹介するケース以外にも、さまざまな用途やシーンで利用されていくと予測されています。
車の自動運転は、AIによるセグメンテーションの代表的な活用事例です。自動運転車は、走行する周囲の物体をAI技術によって瞬時に認識し、信号機や対向車、歩行者、車線などの要素ごとに的確に認識する必要があります。
セグメンテーションにより、周囲の映像をピクセルごとに分割し、正確な処理を行うことが可能です。車の周りの物体や道路標識を処理するためにラベル(意味)付けが行われ、ルールに則った走行が実現しています。
福岡県の「南福岡自動車学校」では、セグメンテーションによる自動運転を用いた「AI教習システム」の試乗会を2020年に実施しました。運転技能検定と教習という2つのシステムで構成されるこのシステムは、運転技術の評価や指導の統一化、教員不足の解消などの効果が期待されています。
顔認証システムは、身近なセグメンテーション活用例の1つです。スマートフォンの顔認証によるロック解除や、施設入館時のセキュリティチェックなど日常生活に浸透しています。
顔認証では、顔のわずかな違いを瞬時に、かつ正確に認識できる高い精度が必要です。防犯や警備の観点からも関心が高まっており、ニーズの増加とともに精度や正確性、スピードの向上が求められています。
画像認証AIベンチャー企業の「データスコープ」は、入退室管理専門メーカー「アート」と業務提携し、「AI顔認証サーマルカメラ」と「入退室管理」を一元管理できるシステムをリリースしました。
入室前にサーマルカメラで温度を測定し、温度と顔が承認された場合のみ解錠され、入室できる仕組みです。個人の体調管理やセキュリティ対策に加えて、検温結果と入退室の記録をAIデータとして蓄積し、応用することもできます。
AIセグメンテーションによる画像認識を活用した外観検査は、さまざまな用途で利用されています。製造業の工場検査における異常検知も、外観検査の1つです。製造ラインにおける不良品の発見や、設備の故障などに役立ちます。
従来は人が目視で行っていたため、熟練作業者への負担が懸念されていました。AI導入によって、作業効率化や人為的ミスの回避、安定した検査品質の維持などのメリットが見込めます。
AI技術の開発やソリューション提供を行う「株式会社アラヤ」では、0.1mm前後の異常を検出できる外観検査AI装置セットをリリースしました。従来の検査機では検出が難しかったごく小さな異常を自動検知できるため、食品製造現場における毛髪やビニールなどの異物混入の予防に役立ちます。
医療現場では、CTやMRIによる医療画像診断を中心にAIセグメンテーションが活用されています。代表的なモデルである「3D U-Net」は、CT解析の自動化によって高精度の診断がリアルタイムで可能です。
また、定期検診や人間ドックなど一度に大量の画像をチェックする場合では、医師不足や個人への負担が大きいなどの課題があります。AI導入により、異常箇所を見落とすリスクの軽減に役立つでしょう。
AI医療機器ベンチャー「アイリス株式会社」は、咽頭画像からインフルエンザ判定を行うAIアルゴリズムを開発。2018年〜2019年度で述べ50万枚以上の咽頭画像を収集し、独自の画像データベースを構築しました。咽頭カメラを含むAI搭載システムは、インフルエンザ判定などでの活用が期待されています。
AI技術を搭載したドローンは、ダムや山間地など人の立ち入りが難しい場所の作業に活躍します。セグメンテーションにより故障や劣化のある箇所を的確に認識できるため、効率的な修理・改善が可能です。
また、人間が隅々まで目視することが大変な農業用地でも、AIドローンが活躍します。上空からAIドローンが敷地内の状況を観察し、植物の栽培や管理を効率化することが可能です。さらに、セグメンテーションにより、現場の撮影画像を用いた収穫量の予測や除草剤散布ポイントの可視化も行えます。
「九州電力」と「株式会社オプティム」は、ドローンとAI解析技術を活用し、点検業務における時間短縮や劣化判断基準の均一化といった効果を実現しました。劣化状況の可視化により、点検業務における大幅なコスト削減にもつながっています。

セグメンテーションは、現代の生活には欠かせない重要な画像認識技術です。良質なデータを用いてAIシステムを的確に活用するためには、高品質なAI技術やアノテーションを要します。自社に適したAIセグメンテーションシステム開発を行うためにも、良質なデータを扱えるアノテーションを選ぶことが大切です。
AIsmileyでは、AIアノテーションの選び方やおすすめサービスをまとめた資料を無料配布中です。実績や得意分野などを一覧で比較できるので、自社に合った企業を見つけるために、下記リンクより無料ダウンロードしてご活用ください。
セグメンテーション(Segmentation)とは、日本語の「分割」という意味があり、機械学習において画像を複数のオブジェクトに分割する技術のことです。
セグメンテーションには大きく分けて3つの種類があります。
セグメンテーションで実現できることの例として、以下が挙げられます。
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら