Supervised Learning(教師あり学習)

AI用語集

AI用語集ではAIに関する用語を中心に
まとめています。
初めて聞く用語や、インターネットを使っていて
わからないことがあったときにお役立てください。

Supervised Learning(教師あり学習)

人工知能における機械学習の手法のひとつ。「教師あり学習」とも呼ばれる。事前に与えられたデータから学習を行う。例題と正解を与えて、そのパターンやルールを認識して学習することで、結果を汎用化し、予測を行う。文字を認識させる場合は文字、音声の場合は音声、画像の場合は画像データを与えてプログラムによって学習させる。

手法

Supervised Learning(教師あり学習)の代表的な手法には、決定木(decision tree)、SVM(Support Vector Machine)、ニューラルネットワークなどがある。

決定木(Decision Trees)は、与えられたデータに対して、条件を満たしているかどうかにより階層的に分類していく学習方法。

SVM(Support Vector Machine)は、1963年にVladimir N. Vapnik, Alexey Ya. Chervonenkisによって発表された。初期は線形分類器にしか適用できなかったが、1992年にカーネル関数を用いることで特徴空間上で線形分類を行う手法が編み出された。

「ニューラルネットワーク」の登場は1943年で、人間の脳にあるシナプスの結合を計算機上にシミュレーションしようと試みたもの。ノード(ネットワーク上の個々の要素)の結合を学習によって強めていく。
1958年にFrank Rosenblattがパーセプトロンを開発した。形式ニューロンを入力層と出力層に分けて接続の重み付けをした。しかし学習できない問題の方が多かった。
1979年には福島邦彦がネオコグニトロンを発表、文字認識に利用する。これが後に畳み込みニューラルネットワークに発展する。
1986年にDavid E. Rumelhartたちによって、バックプロパゲーションを発表。隠れ層を追加して3層構造にする。層を増やせば学習力が高まると考えられたが、この試みは失敗する。
その後、2006年にGeoffrey Everest Hintonたちによってオートエンコーダ、ディープ・ビリーフ・ネットワークが提案され、現在のディープラーニングに発展する。

活用方法

たとえば「迷惑メール」の判別に用いられる。迷惑メールと判断したメールとそれ以外メールのデータを人間が手動で蓄積し、特徴を学習させる。手書き文字の認識などにも、特徴量を理解させて用いられている。

関連する他の用語