1. TOP
  2. ブログ
  3. AIが創造する世界:先進的な文字生成AI・画像生成AIの概観

AIが創造する世界:先進的な文字生成AI・画像生成AIの概観

AIがもたらす革新の波は、多くの領域で著しい進歩を遂げています。その中でも特に、文字生成と画像生成の技術は注目に値する進展を見せています。OpenAIのChatGPTなどの文字生成AIは、ユーザーの多様な質問に情報を提供しつつ、自然な対話を実現します。これらの技術は、私たちの日常生活やビジネスシーンに新たな可能性をもたらしています。
画像生成の分野においてはOpenAIのDalle2やMidjourneyといった画像生成のAIはユーザーの説明に基づきリアルな画像を生成してくれます。
これにより短時間で、これまでになかった画風や、新しいキャラクターなどを描き出すことが可能になりました。
そんなAIについて本記事では触れていこうと思います。

この記事でわかること
・まず、AIって何でしょうか?
・AIの歴史
・文字生成AIの使用目的
・画像生成AIの使用目的

AIってなに

ご存じの方も多いかとは思いますが、軽くご説明をさせていただきます。
AI(Artificial Intelligence)とは「人工知能」を指す言葉です。人間が持っている知識を理解し、問題解決能力や学習能力、感覚認識など、人間が持つ「知性」を機械に実装する技術や研究領域のことを指します。
つまりは、人間のような膨大な知識を機械に学ばせることで、特定の知識分野についていつでも簡単に知識を取り出せる上に、忘れることがない第2の脳みそにしてしまおうというものです。

AIの歴史

AIの歴史は長く、最も古いものでは1950年までさかのぼります。どのようにして今のAI技術の基盤ともなる技術が発展を遂げたのかを軽く振り返ってみようと思います。
1950年代 – チューリングテスト:チューリングテストは人間とAIによって生成された文章の会話が成り立つのかという試験です。人を1人、人間かAIかわからないものと文字での会話をさせ、それが人だったのかAIだったのかを計るものです。
この時代に人工知能のもとになる概念が作られたとされています。自ら思考し答えを出す機械という概念の誕生です。

1960年代 – ELIZA(イライザ): ELIZAは、1960年代初頭の人工知能プログラムで、最初の対話型AIとも言えます。ELIZAは、ユーザーの入力に基づいて簡単な英語の応答を生成します。この研究を最後に現実にあるような答えがあいまいな問題への対応の難しさから、これまでのAIブームが一度幕を閉じてしまうのです。

1980年代 – 第2次AIブーム RacterとChatbots: Racterは、擬似的な人間の会話を生成する能力を持つ初のソフトウェアでした。同じ時期に、最初のチャットボットも開発されました。第2次AIブームでは知識を学習させることで難しい問題もAIが解決してくれるようになるのではないかということで起きました。しかし、人間の知識というものは計り知れないもので、それらの学習の大変さから、またAIブームは過ぎ去ってしまうのです。

2000年代 -第3次AIブーム 順次的なモデル: 課題であった膨大な情報の学習をビッグデータや、ディープラーニングという概念の登場により解決し、再度AIの可能性は大きく広がりを見せるようになりました。

このころには、系列予測モデルが登場しました。これらのモデルは、テキストデータのパターンを学習し、新しいテキストを生成することが可能になりました。初のニューラルネットワークとリカレントニューラルネットワーク(RNN)も開発されました。

2010年代 – TransformerとGPT: TransformerとGPT(Generative Pre-training Transformer)が登場しました。Transformerは、自己注意メカニズムを使用して、入力の一部だけでなく、全体的な文脈を考慮することができます。GPTは、大量のテキストデータを学習し、それに基づいて新しいテキストを生成する能力を持っています。

これら以外にも、各分野で新進気鋭のAIが登場し始めます。記憶に新しいもので言えば囲碁のAlpha-Goなどです。

2020年代 – GPT-3、GPT-4: GPT-3は、非常に大規模なモデルで、その性能は一部で人間の書き込みを模倣することができます。GPT-3は、一部のNLPタスクで人間の性能を超えることが証明されました。GPT-4は、更に改良が施され、より高度な自然言語生成能力を持っています。

これ以降の時代を第4次AIブームとさすAI科学者もおり、AI時代に大きな変化があったことは確かです。

 *2から部分的に参照

現在と未来: 現在、人工知能は人間のように文章を書き、人間のように情報を理解し伝達する能力を向上させています。また、これらのAIは、新たな文章を生成するだけでなく、あらゆる種類の情報を理解し、複雑な問いに対して回答を提供する能力も高まっています。

歴史を振り返ると、AIの技術は少しずつ積み重ねられ、進歩したというよりある時期を境に急激な発展を遂げているということがわかります。

では、現在ではAIはどのようなことに使用されているのでしょう。実際の使用例を挙げながら確認していきたいと思います。

文字生成AIの使用目的

・情報収集
文字生成AIに対して質問をするとそれに対する回答を要約した文章で生成してくれます。かなり専門的な分野の知識や用語であっても回答してくれるため、情報収集にかかる時間がかなり短縮されます。

・文章の添削
近頃では就活生が企業に出すエントリーシートなどを文字生成AIから作られたツールによって添削してもらうそうです。

・プログラムのコード作成補助
こういうコードを作ってというように、文字生成AIに対して指示を出すと、全体の大枠を完成させてくれます。そのままそのコードが正常に動く場合もあれば、一部が間違っていてうまく動かないものを生成するときもあります。しかし、人間が1から考えて生成するよりはかなり速いスピードで作成してくれることは間違いないです。

・画像生成AIへの指令文の作成

画像生成AIの中にはおまじないのようなアルファベットを打ち込んで画像を生成するものもあります。それらの仲介役として文字生成AIに対して「Midjourneyで、犬が庭で遊んでいる画像を生成したいから生成分を考えて」というようにお願いすればそれに合わせたものを作成してくれます。
なお、これには事前にMidjourney用のプロンプト生成の基本的な方法を学習させる必要があります。

画像生成AIの使用目的
・画像を生成しそれを販売する
画像自体を生成し、それを商品とします。今の流行としてはNFT(Non-Fungible Token)として、使用されるたびに使用料のような形で取引が行われるという形式があります。

・画像を生成しそれを広告に使用する
自社の宣伝動画や、画像などに生成した画像を差し込むという利用方法です。画像生成AIで生成した画像であれば、月々の利用料等はかかりますが画像そのものは自分が作成したものなので使用に関する料金がかかりません。

まとめ

文字生成AIと画像生成AIなどというサービスは数年前にはここまで進歩し商業利用に足るものになるとは思われていなかったものです。これらの技術は日々進化し続けています。本記事で紹介したものも、ほんの一例にすぎません。
私たちはこのようなテクノロジーがもたらす無限の可能性を探求し続けることで、新たな価値と驚きを生み出されることでしょう。

建設・土木業界向け 5分でわかるCAD・BIM・CIMの ホワイトペーパー配布中!

CAD・BIM・CIMの
❶データ活用方法
❷主要ソフトウェア
❸カスタマイズ
❹プログラミング
についてまとめたホワイトペーパーを配布中

■参考サイト
*1 PROMPTY 画像生成AI「Midjourney」の始め方をご紹介!料金・使い方を紹介
  画像生成AI「Midjourney」の始め方をご紹介!料金・使い方を紹介 | PROMPTY (bocek.co.jp)

*2 AIsmiley AI・人工知能の歴史について年表を活用しながら時系列で簡単に紹介
AI・人工知能の歴史について年表を活用しながら時系列で簡単に紹介 | DXを推進するAIポータルメディア「AIsmiley」
■参考書籍
*3 深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版

    カテゴリ一覧

    PAGE TOP