Deep Learning(ディープラーニング)

AI用語集

AI用語集ではAIに関する用語を中心に
まとめています。
初めて聞く用語や、インターネットを使っていて
わからないことがあったときにお役立てください。

Deep Learning(ディープラーニング)

Deep Learning(ディープラーニング)とは、ニューラルネットワークを用いた機械学習モデルの事。Deep Learningに用いられるニューラルネットワークは、通常入力層・中間層・出力層の3層以上存在するものを言う。

2012年にコンピュータによって物体を認識する技術を競う大会ILSVRCで、トロント大学がニューラルネットワークを用いた機械学習でエラー率17%という驚異的な数値で2位を大きく引き離し優勝した。
これをきっかけに画像認識、音声認識などの分野で第三次人工知能ブームがもりあがり、結果、実用的なサービスとして定着している。

Deep Learningによる機械学習は汎用的なAI(強いAI)を実現する技術として期待されているが、現在の所は機能特化のAIのみが実用化されている。

ニューラルネットワークの特徴

ニューラルネットワークの入力層にデータを投入すると、中間層を経由して出力層に出力される。中間層において、コンピュータが入力された情報の特徴量を計算するのだが、これまでの機械学習は、特徴量をコンピュータ技術者が手動で設定していたものを、コンピュータが自動で行うところにDeep Learningの特徴がある。

特徴量が判明すると画像や音声のパターン認識や分類が可能になる。
実際に現在Googleなどが実用化している、画像認識技術や音声認識技術は、Deep Learningの成果となっている。

ニューラルネットワークは、当初は直線的で簡易なものであったが、現在は分岐やループを含む複雑なものになっている。

ニューラルネットワークの種類

・CNN(Convolutional Neural Network)畳み込みニューラルネットワーク
画像や自然文章の解析に用いられることの多いモデル。畳み込み層とプーリング(最大値や平均値を取る処理)層を交互に配置することによって特徴を抽出し、最終的に全結合層で認識を行う

・RNN(Recurrent Neural Network)再帰型ニューラルネットワーク
RNNは現在最先端のニューラルネットワークの技術で、特徴は中間層に対してフィードバックをおなうことができる点である。
自然文の解析や音声認識に利用され他にもロボットや自動車の自動運転の強化学習にも利用される。
Long Short-Term Memory(LSTM)というRNNモデルがシンプルで学習しやすいため人気がある。

・その他のモデル
全結合型(フィードフォワード)は中間層が全て全結合層なのが特徴で、音声認識などに利用される。
オートエンコーダは、ノイズ削除や次元削除に有効なモデルで、入力データ自体を教師データとする教師なし学習を行う事が特徴となっている。

関連する他の用語