盛り上がりを見せる生成AI、5年後にはどのような姿になっているか考察してみた
ChatGPTの登場で、生成AIは一気に世界中から注目される存在になりました。
いまはまだ、実用レベルでは黎明期と呼べる生成AIですが、突然の大きすぎる衝撃に、どうビジネスに活かすのか、課題の洗い直しを急ぐ企業、これを機に先手を取ろうと積極導入する企業、様々な姿が見られます。
ただ、「生成AIがある世界」の始まりは、まだ序章に過ぎません。
これから5年後。
生成AIのある世界はどうなっているのか。
その可能性を考えてみましょう。
生成AIの現在地
質問や要望を入力すると、まるで人間が返事しているような自然な言語で応えてくれるChatGPTは、世界で多くの人に衝撃を与えたと言っても過言ではありません。
そして企業の間でも、取り入れない手はない、情報漏洩など安全性に疑問があり検証したい、と様々なスタンスが生まれています。急激すぎる技術の進化に驚きを隠せないといった具合でしょうか。
導入フェーズは3つに分かれる
ベイン・アンド・カンパニーがグローバル大手企業約600社を対象に実施した意識調査によると、半数近い企業が何らかの形で生成AIの活用を検討し、また、一部の企業はすでに導入しているとの回答が得られています(図1)。
グローバル大手企業の生成AI導入段階
(出所:「Compass vol.1 生成AIがもたらす未来:企業導入の原則」ベイン・アンド・カンパニー)
そのうえで、ベイン・アンド・カンパニーは、生成AIの導入状況によって、企業を3パターンに分類しています。
生成AI活用における企業の3段階
(出所:「Compass vol.1 生成AIがもたらす未来:企業導入の原則」ベイン・アンド・カンパニー)
しかしここにきて、様子見だった企業がChatGPTの積極利用に舵を切る様子があります。
例えば金融業界です。日経クロステックによれば、2023年3月初旬の時点ではChatGPTの活用に対して慎重な姿勢を示す大手金融機関が少なくなかったといいます。
しかしここにきて、メガバンクを中心に姿勢を一転させ、導入に意欲を見せ始めているのです*1。
生成AIの活用は不可逆な流れ、と捉える金融機関もあります*2。
大規模言語モデルの開発競争が幕開け
さて、ChatGPTなど生成AIを支えているのは「大規模言語モデル(=LLM)」です。自然な言語を生成するためには「単語と単語の繋がりを何パターン学習しているか」がアウトプットの精度に反映されます。
まさに生成AIの肝といえます。
その1つの単位を「パラメーター」と呼びます。
ChatGPTをきっかけに脚光を浴びることになったLLMですが、実はLLM自体は以前から開発競争が続いていました。
2018年にマイクロソフトが公開した言語モデル「BERT」は3億4000万のパラメータを持ち、文章読解でベンチマークを超えたとされました*3。
しかしその後、2019年2月にOpenAIの「GPT-2」が15億のパラメーターを持ちましたが、当時偽ニュースまで自動生成してしまうことで話題となっています。
その後は2019年9月に米エヌビディアが作った「Megtron-LM」が83億のパラメーターを持つようになっています。
しかし、2020年6月に「GPT-3」は1750億という桁外れのパラメータを学習しています*3。
GPT-2の開発から1年少しでOpenAIのGTPシリーズは15億から1750億とそのパラメータ数を爆発的に拡大しています。
GPT-3.5のパラメータ数が3550億と言われています*4。
OpenAIはGPT-4については詳細を明かしていませんが、このペースでいけば1兆という数字も技術的にはおかしなことではありません。
そして、LLMを巡っては現在、マイクロソフト、メタ、グーグル、アマゾン・ウェブ・サービス、セールスフォースなど大手を始め様々な企業が開発競争を繰り広げています5。 また、日本でもNEC、NTT、サイバーエージェント、富士通などが独自のLLM開発に名乗りを上げているところです6。
産業技術総合研究所も大学などと協力し、1750億パラメータの国産LLM開発に乗り出しています。
産業技術総合研究所のLLM構想
(出所:「産総研の計算資源ABCIを用いて世界トップレベルの生成AIの開発を開始」産業技術総合研究所)
https://www.aist.go.jp/aist_j/news/pr20231017.html
今後、コストやサーバーのメモリの限界といった壁も出てくることでしょうが、そういった制約を各社がどう乗り越えていくかは注目したいところです。
LLMを無限に大きくすることは不可能です。どこかで「落とし所」のようなものが現れるのではないかと筆者は考えます。
2026年には8割の企業が利用との見解も
では、近い将来、生成AIはどう使われるでしょうか。
米系ITアドバイザリー企業のガートナーは、生成AIに対応したアプリケーションを本稼働環境に展開する企業は80%にのぼるとの見解を示しています*7。
また、生成AIをより実用的なものにする技術として「マルチモーダルAI」にも注目が集まっています。
現在話題になっているChatGPTなどは、「言語をもとに文章などを生成する」という特徴があります。視覚情報や聴覚情報はまた別の次元にあります。
そこで、複数の情報(モーダル)をもとに帰結をアウトプットするのが「マルチモーダルAI」です。
(出所:「マルチモーダルAIとは?身近な事例で解説します!」NTTデータ)
https://www.nttdata.com/jp/ja/data-insight/2021/1101/
例えば防犯にAIを利用するとします。
画像と音声を統合して分析することで、下のようなことが可能になります。
(出所:「マルチモーダルAIとは?身近な事例で解説します!」NTTデータ)
https://www.nttdata.com/jp/ja/data-insight/2021/1101/
状況を判断して文章を生成し、カメラに「喋らせる」こともできることでしょう。
AIは言語や画像、音声などを意味を持って理解しているわけではありませんが、それらの「組み合わせのパターン」を大量に学習することができます。人間の経験の数をはるかに超えていることでしょう。
特に、人が「大声でたむろしている」姿は、画像だけではただそこにいるだけなのか騒いでいるのか判断がつきません。しかしそこに音声という情報を組み合わせることで、話しているだけなのか騒いでいるのかがわかる、という具合です。
AIは言語や画像、音声を何か意味のあるものとして認識しているわけではありません。
しかしそれらの組み合わせのパターンと起こりうる確率を、人間の経験よりはるかに多く学習することができます。
今後、AIが言語だけでなく「目」や「耳」を持つようになることでどう進化していくのか、そのような観点からも注目したいところです。
建築・土木業向け BIM/CIMの導入方法から活用までがトータルで理解できる ホワイトペーパー配布中!
❶BIM/CIMの概要と重要性
❷BIM/CIM導入までの流れ
❸BIM/CIM導入でよくある失敗と課題
❹BIM活用を進めるためのポイント
についてまとめたホワイトペーパーを配布中
*1
「3メガ銀と損保大手が「ChatGPT」への慎重姿勢を一転、導入に意欲をみせる理由」日経クロステック
https://xtech.nikkei.com/atcl/nxt/column/18/00001/08083/?P=2
*2
「ChatGPT対応に温度差、メガバンクなど大手金融7社が明かすAIへの取り組み」日経クロステック
https://xtech.nikkei.com/atcl/nxt/column/18/02423/041000002/
*3
「最新AI「GPT-3」の威力と弱点、モデル巨大化が進化を支える」日経クロステック
https://xtech.nikkei.com/atcl/nxt/column/18/01428/092300002/?P=2
*4
「話題の「ChatGPT」、そのすごさと″限界”のワケ」東洋経済オンライン
https://toyokeizai.net/articles/-/657537?page=2
*5、6
「ChatGPT産業革命」日経BPムック p83、p98
*7
「Gartner、「生成AIのハイプ・サイクル:2023年」を発表-2026年までに、企業の80%以上は生成AIのAPIを使用して、生成AIに対応したアプリケーションを本番環境に展開するようになる」
https://www.gartner.co.jp/ja/newsroom/press-releases/pr-20231012