「機械学習」「人口知能」「データサイエンティスト」といった言葉の違い
2011年頃から、「ビッグデータ」という言葉をよく聞くようになりました。
2013年には「データサイエンティスト」という言葉・職業を、
2015年からは「機械学習」や「人工知能」が取り上げられています。
現在は、「ディープラーニング」等もよく聞きますね。
今回は、これらの用語や歴史的な経緯などを解説していきます。
ビッグデータとは?
ビッグデータに限らないことですが、正確な、はっきりとした定義は中々されていないのが現状です。
ビッグデータを「事業に役立つ知見を導出するためのデータ」とし、
ビッグデータビジネスを「ビッグデータを用いて社会・経済の問題解決や、業務の付加価値向上を行う、あるいは支援する事業」
と定義している例や、
「典型的なデータベースソフトウェアが把握し、蓄積し、運用し、分析できる能力を超えたサイズのデータを指す」
といった見方もあります。
非常に膨大で複雑なデータであり、事業に役立つデータと考えるのが一般的です。
最近ではインターネットの発展によりデータが収集できる機会が増えたことや、低価格で容量の大きいネットワーク、ストレージにより大規模なデータが収集されるようになりました。
その大規模なデータをビジネスで活かす例が多くなったことが、2011年頃からのビッグデータがトレンド入りした経緯でしょう。
データサイエンティスト
このデータサイエンティストという言葉をよく聞くようになったのは、先ほどのビッグデータがトレンドになった流れを汲んでいます。
膨大なデータがあるからといって、それをすぐにビジネスに活かすことは難しいのが現状です。
そのため、この大規模なデータからビジネス上有意義な情報をなんとか抽出する必要があり、その専門家である「データサイエンティスト」
が求められました。
しかし、このデータサイエンティストを用意すればそれで済むかというと、そうでもなかったようです。
そもそも、日本においては、データサイエンティストは多くはいません。
また、データが複雑すぎる等の理由で人間では仮説を正しく立てられなかったり、精度が低いというケースもありました。
機械学習・人工知能
人間では難しいなら、機械ではどうだろうか。
ということで、機械学習や人工知能への注目が集まっています。
ですが、注目された理由はビッグデータ~からの流れを汲んでいると同時に、別の要因もあります。
そもそも機械学習とは?
機械学習は、人工知能研究から生まれた分野です。
一言で言うならば、「人間が行っている学習という能力を、コンピュータに行わせること」で、これは人工知能の要とも言える課題となっています。
数十年前から研究分野として確立され徐々に発展し、国際会議が開かれたりもしています。
では人工知能は?
人工知能という言葉の定義は実際のところ曖昧で、研究者によってズレがあるようです。
一般的には、「コンピュータに人間のような知性と知能を持たせる」のように説明されることが多いでしょう。
今とても注目を集めている人工知能ですが、実は過去に2度、大きな注目を集めています。
1960~1970年に一度目、1980年代に二度目です。
そして今が三度目の注目となっています。
なぜ今になって注目を浴びているか、別の要因
世界的にはIBMの「Watson」がアメリカのクイズ番組「ジェパディ」にチャレンジし、勝利したことがきっかけと言われています。これは2011年の出来事です。
将棋の「電王戦」での活躍は、皆さん知っているかもしれません。
日本においては、この電王戦での活躍によって大きな注目を浴びているように感じます。
また、2016年の1月28日に、今まで勝ったことのない囲碁の世界にて、
Google(の完全子会社であるイギリスのディープマインド社)が開発した「アルファ碁」が勝利しました。
アルファ碁には今有名な「ディープラーニング」の技術が使われており、こうした新しい技術が生まれたことも、注目を浴びている理由のひとつでしょう。