教師あり学習とは?手法・具体例・教師なし学習との違いを紹介
最終更新日:2024/04/03
第三次AIブームと呼ばれる現代において、AI(人工知能)は私たちの生活に必要不可欠な存在になりつつあります。近年は少子高齢化に伴う人手不足が深刻化していることから、今後さらにAI活用の幅は広がっていくことが予想されるため、より深くAIについて理解してくことが大切になるでしょう。
今回は、そんなAIの基礎を学ぶ上で欠かせない「教師あり学習」について解説するとともに、その種類や具体例についても詳しくご紹介していきますので、ぜひ参考にしてみてください。
機械学習について詳しく知りたい方は以下の記事もご覧ください。
機械学習とは何か?種類や仕組みをわかりやすく簡単に説明
教師あり学習とは
AIには、機械学習という要素技術が存在します。その機械学習は、データの種類や状況などに応じて「教師あり学習」「教師なし学習」「強化学習」という3つに分けることができ、機械学習において重要な役割を担っています。
教師あり学習(Supervised Learning)とは、その名の通り、教師となるデータをもとに学習していくものであり、不明なデータを持ち寄った場合には正解を教えてくれるというイメージで問題ありません。そのため、正解となるデータを大量に学習していくことで、新しいデータにも対応することができるようになるのです。
教師あり学習は、以下の「学習」「認識・予測」という2つのプロセスによって成り立っています。
- 学習…正解のデータを用いてルールやパターンの学習
- 認識・予測…新しくインプットされた「まだ正解がわからないデータ」に対して、これまでに学習したデータを用いて認識・予測
教師なし学習、強化学習との違い
「教師なし学習(Unsupervised Learning)」や「強化学習(Reinforcement Learning)」とはどのような違いがあるのでしょうか。
「教師なし学習」は、その名の通り教師データが必要ありません。膨大なデータの学習を行うわけではなく、データそのものが持っている構造や特徴の分析を行っていくため、グループ分けやデータ簡略化といった作業がメインになります。つまり、「教師あり学習」との分かりやすい違いとしては、「教師データを必要とするかどうか」という点だといえるでしょう。
そして「強化学習」は、AIが報酬の獲得を求めて能動的に学んでいく機械学習モデルのことを指します。その一例としては、囲碁AIや将棋AIなどが挙げられるでしょう。
また「教師あり学習」と「教師なし学習」を組み合わせた「半教師あり学習(Semi-Supervised Learning)」という手法も存在します。「半教師あり学習」の場合、学習データに「正解ラベルがついているデータ」「正解ラベルがついていないデータ」の両方を使用するのが特徴です。
「半教師あり学習」の流れとして、まず正解ラベルが付与されている一部のデータを利用し、残りの正解ラベルなしのデータに対して事前予測を行っていきます。そして、最後にすべてのデータを統合していくというものです。
通常は、大半の学習データには正解がついていません。そのため、モデル学習のためのデータを取得したり、正解ラベルをつけたりする作業を行うためのコストが発生するのが一般的です。正解ラベル付きのデータを十分に用意できない状況では、「半教師あり学習」が役に立つ可能性が高くなります。
ただ「半教師あり学習」にもデメリットは存在します。それは「教師あり学習」に比べて精度が低い傾向にあるという点です。「半教師あり学習」の場合、正解ラベルをつけるときに偏りが多少生じる可能性があります。この偏りが、精度を低下させてしまう原因となるのです。
また、予測したラベルの正確性については確認することができないという点も一つのデメリットといえるでしょう。そのため、信頼性という面においては「教師あり学習」のほうが優れているといえます。
こういった点を踏まえると、正解ラベルが付与された学習データを用意することができる場合には、「教師あり学習」を利用するのがおすすめといえるでしょう。
まとめると、どんな作業をAIにさせたいかによって使う手法が変わってくるということです。
- 「教師あり学習」過去のデータを元に正解を見つけたい場合(需要予測、株価予測、音声認識)
- 「教師なし学習」どのようなグループ分けができるのかを新たに発見したい場合(画像生成、異常検知)
- 「半教師あり学習」正解ラベルが十分に用意できない場合(自然言語処理、画像認識)
- 「強化学習」価値を最大化する行動をしたい場合(ゲーム、自動運転、エレベーターの制御)
教師あり学習の種類
教師あり学習には、「回帰」「分類」という2つの種類が存在します。これら2つには、どのような特徴、違いがあるのでしょうか。ここからは、教師あり学習の種類について詳しくみていきましょう。
回帰
回帰とは「連続する数値の予測」のことです。
例えば、天候や平均気温といったデータとアイスクリームの販売個数の関係を学習することによって、「この平均気温であればこれくらいの売り上げが期待できる」といった数値の予測を行うことが可能になります。飲食店を例にした場合には、過去に訪問した飲食店の情報をもとに「新しい飲食店に何回訪れるか」を予測します。回帰の目的は「何回訪れるか」という具体的な値を予測することです。
その他に、家や車の価格を予測をするなどの例が挙げられます。
分類
分類は「あるデータがどのクラスに属するかの予測」を指すものです。
例えば、迷惑メールと判別されているクラスのデータから、文章の特徴やクラスの関係を学習することによって、新着メールが迷惑メールかどうかを予測することが可能になります。また、飲食店を例にすると、過去に訪問した飲食店の情報をもとに「新しい飲食店を気に入るかどうか」を予測します。分類の目的は「気に入るか、気に入らないか」というグループ分けを予測することです。
その他には、動物の画像データから犬、猫、鳥などを分類するなどの例が挙げられます。
教師あり学習を活用する際の注意点
教師あり学習を活用する際には以下の点に注意しましょう。
正確な学習データを用意する
学習データが正しくラベル付けされていない場合、精度が低い結果を出してしまいます。学習データは正しいかつ、最新のものを用意しましょう。
十分な学習データを用意する
ラベルが不足している場合も、AIが十分に学習できず精度の低い結果を出してしまいます。ラベルが十分用意できない場合は、教師なし学習や半教師あり学習を活用することも検討しましょう。
教師あり学習の具体例
教師あり学習は、さまざまな種類のAIに活用されているものです。では、具体的にどのような場所で教師あり学習が活用されているのでしょうか。ここからは、教師あり学習の具体例についてみていきましょう。
需要予測
教師あり学習の代表的な事例として挙げられるのが、需要予測システムです。需要予測システムとは、蓄積されたデータの分析を行うことによって、在庫の最適化や収益の最大化などを実現するシステムのことです。一見、一連の作業すべてを自動化できる魅力的なシステムのように感じられるかもしれませんが、需要予測における一連の作業をすべて自動にできるというわけではありません。
より高い精度で需要予測を行うためには、「現状の業務把握」をヒアリングする必要があるからです。ただ、ヒアリングによって業務把握を行い、その上で「過去の実績」「天候による影響」といった要素を加えて需要予測モデルを構築していけば、より高い精度のシステムに仕上げることが可能になるのです。
そのため、最初に行われる「ヒアリング」という作業は、結果的に業務負担を大幅に軽減させる極めて重要なものであるといえるでしょう。また、適切なデータを活用し続けるためには、定期的なデータ検証・改善の作業も重要になります。
こういった作業を定期的に行うことで、在庫切れによる機会損失や在庫過剰による廃棄のリスクを軽減させることが可能になるため、結果的に収益の最大かにつなげることができるのです。
イオンの需要予測システムについて詳しく知りたい方は以下の記事もご覧ください。
イオン、需要予測・発注システム「AIオーダー」を開発、発注時間削減と発注精度の改善を同時に実現へ
株価予測
株価予測とは、その名称からも分かるように将来の株価を予測することです。蓄積された過去のデータを学習データとして利用することができるため、教師あり学習が活用できます。
これは株価だけでなく外国為替(FX)などにも適用できるものなので、主にFXの自動売買ツールなどにこの技術が用いられています。また、最近では証券会社も積極的に機械学習による株価予測を活用し始めている状況です。
画像認識
画像認識も教師あり学習が用いられている事例の一つとして挙げられます。画像認識とは、画像の中に写っているものをコンピュータが判別していく技術のことです。コンピューターからすれば、画像データは画素値の羅列にしか過ぎません。しかし、画像認識の技術を活用することによって、「そこに何が写っているのか」の判別を行えるようになるのです。
その一例としては、AI搭載型のカメラによる「物体検知」や「文字認識(OCR)」が挙げられるでしょう。これらは、まさに教師あり学習を用いた画像認識技術といえます。
物体検知の場合、教師なし学習も存在しますが、一般的には「物体の写真と物体の名称のセットを大量に学習させていく」という方法の教師あり学習が多く用いられます。この方法の場合、学習後のモデルに新しい写真を見せることによって、「その物体は何か」の検知を行うことが可能になるわけです。
音声認識
音声認識も、代表的な教師あり学習の活用事例の一つです。音声認識とは、人間が発する声などをコンピューターに認識させる技術のことです。
話している人が誰なのか判別したり、話し言葉をテキストデータに変換したりすることができます。
最近では、スマートスピーカーやスマホの音声アシスタントなど、身近な製品(サービス)も多くなってきたため、多くの人に親しまれている技術といえるでしょう。たとえばAmazonが提供している「Alexa」なども、教師あり学習による音声認識技術が活用されているのです。
自然言語処理
自然言語処理も、教師あり学習が活用されている事例の一つです。自然言語処理とは、人間が話す言語をコンピュータに処理させる技術のことです。
音声認識、機械翻訳などとの関連が深い技術であり、さまざまな分野で活用されているため、AI技術の中でも特に大きな注目を集めています。
教師あり学習が用いられている分野は幅広く、現在でも進化をし続けているため、目が離せない技術といえるでしょう。以下のページでは、教師あり学習はじめとするAI活用ニュースをご紹介していますので、ぜひこちらも併せてご覧ください。
AIについて詳しく知りたい方は以下の記事もご覧ください。
AI・人工知能とは?定義・歴史・種類・仕組みから事例まで徹底解説
- AIサービス
- 機械学習
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI・人工知能記事カテゴリ一覧
AI・人工知能サービス
- 生成AI
- 画像生成AI
- ChatGPT
- AI研究開発
- LLM
- DX推進
- おすすめAI企業
- チャットボット
- ボイスボット
- 音声認識・翻訳・通訳
- 画像認識・画像解析
- 顔認証
- AI-OCR
- 外観検査
- 異常検知・予知保全
- 自然言語処理-NLP-
- 検索システム
- 感情認識・感情解析
- AIモデル作成
- 需要予測・ダイナミックプライシング
- AI人材育成・教育
- アノテーション
- AI学習データ作成
- エッジAI
- IoT
- JDLA
- G検定
- E資格
- PoC検証
- RPAツール
- Salesforce Einstein
- Watson(ワトソン)
- Web接客ツール
- サプライチェーン
- メタバース
- AR・VR・デジタルツイン
- MI
- スマートファクトリー
- データ活用・分析
- 機械学習
- ディープラーニング
- 強化学習
- テレワーク・リモートワーク
- マーケテイングオートメーション・MAツール
- マッチング
- レコメンド
- ロボット
- 予測
- 広告・クリエイティブ
- 営業支援・インサイドセールス
- 省人化
- 議事録自動作成
- 配送ルート最適化
- 非接触AI
業態業種別AI導入活用事例
今注目のカテゴリー
AI製品・ソリューションの掲載を
希望される企業様はこちら