画像生成AIサービスとは?種類や活用事例を紹介
近年、画像生成AIサービスの進化が止まりません。しかし、「そもそも画像生成AIサービスって何?」「どのような種類があってどのような違いがあるの?」などの疑問を持たれている方も多いのではないでしょうか?
そこで今回は、画像生成AIサービスとは何か、その種類や特徴、さらには活用事例などを紹介します。
この記事を読むと、以下のことがわかります。
1.画像生成AIとは何か、その歴史
2.画像生成AIサービスの種類とそれぞれの特徴
3.画像生成AIの活用事例
画像生成AIサービスとは?その歴史や成り立ち
画像生成AIとは、プロンプトと呼ばれるユーザーからの指示を文字で打ち込めば、AIが画像を生成してくれるものです。
そして、画像生成AIサービスとは、その名の通り画像生成AIを利用できるサービスを指します。後述しますが、このサービスには、画像生成AIの代表的な3種類のサービスが存在します。
ユーザーは自分が創り上げたい作品のイメージを文章として画像生成AIサービスに打ち込み、指示を出します。たとえば、「女性、黒髪、雨、傘をさす、美人」や「未来都市、空飛ぶ車、高層ビル、ネオン」などです。
画像生成AIの歴史の始まりは、2014年までさかのぼります。カナダのモントリオール大学の学生だったイアン・グッドフェローが、「敵対的生成ネットワーク(GAN)」と呼ばれる生成モデルの新しい技術を開発したのです。この技術によって、簡単な画像はもちろん、本物の写真のような複雑な画像まで生成できるようになりました。
その後研究者の間では画像生成AIの技術開発合戦が始まったのです。
2016年には、Facebook社(当時)とスタートアップ企業がGANを改良し、特定の文章の指示に対して画像を生成できる技術を発表しました。
その後も各社で開発は進み、2021年にはChatGPTで有名なアメリカのOpen AI社が、文章による指示を基に印象的な画像を生成するシステム「DALL·E」を公開しました。印象的な画像とは、現実では起こりえない、もしくは起こりづらい現象を表す画像のことです。たとえば、「電卓を使う猫」「人間を散歩させる犬」などです。
OpenAIは同社の画像生成ツールが悪用されることを懸念して、当初はサービスを一部の人にしか公開していませんでした。しかし、「DALL·E」が公開されたことによってさらに技術開発合戦は進み、とうとう「画像生成元年」と呼ばれる2022年がやってきます。
各社が続々と画像生成AIサービスを一般公開し始めたのです。ここから現在に至るまで、さまざまなサービスやツールがリリースされ、その熱は高まっています。
代表的な画像生成AIサービスの種類と特徴
画像生成AIサービスには、大きく3つの種類があります。それぞれ解説していきます。
Midjourney
Midjourneyは、アメリカの研究チーム「Midjourney」が2022年7月にリリースした画像生成AIサービスです。各社が画像生成AIサービスを一般公開する先駆けとなりました。
Midjourneyでは、高品質な画像が生成できるのが特徴です。2023年3月までは無料で利用できていましたが、現在は有料プランに加入しないと利用できません。有料プランは「Basic Plan」「Standard Plan」「Pro Plan」「Mega Plan」の4種類があります。
プラン | 料金 | 特徴 |
Basic Plan | 10ドル/月(年間契約の場合8ドル/月・96ドル/年) | ・200回までの生成が可能 ・jobは最大3つまで同時処理 |
Standard Plan | 30ドル/月(年間契約の場合24ドル/月・288ドル/年) | ・15時間までのファストジェネレーション付き・速度制限はあるが、無制限で画像生成が可能・jobは最大3つまで同時処理 |
Pro Plan | 60ドル/月(年間契約の場合48ドル/月・576ドル/年) | ・プロンプトを非公開にできる・ファストモードが30時間利用可能・jobは最大12まで同時処理 |
Mega Plan | 120ドル/月(年間契約の場合96ドル/月・1152ドル/年) | ・Pro Planの全ての機能に加え、ファストモードが60時間利用可能 |
Stable Diffusion
Stable Diffusionは、イギリスのスタートアップ企業であるStability AIが2022年8月にリリースした画像生成AIサービスです。リアル調からアニメ調まで画像生成ができるのが特徴です。
Stable Diffusionはオープンソースのため、Webサイト上やPCにインストールし利用できます。さらに、基本的には無料で使用できるうえ、作成可能な画像枚数に制限がありません。
なお、Stable Diffusionで生成した画像は基本的に商用利用可能ですが、モデルによっては商用利用が認められない場合もあるため注意が必要です。また、昨今画像生成AIの商用利用は著作権侵害にあたるという訴えも増えてきており、利用には細心の注意を払いましょう。
Stable Diffusion公式サイト
DALL・E3
DALL・E3は、Open AI社が先述した「DALL·E」を進化させ、2023年9月にリリースした画像生成AIサービスです。
現実では起こりえない、もしくは起こりづらい現象を画像生成できる「DALL·E」の特徴はそのままに、生成の精度や画像のクオリティが高くなりました。もちろんリアルな画像生成も可能です。
利用するには、ChatGPTの有料会員であるChatGPT Plusに加入する必要があり、月額20ドルがかかります。
DALL・E3公式サイト
画像生成AIサービスの活用事例
画像生成AIは、個人で楽しむだけでなく、企業も業務効率化などを目的に積極的に活用しています。今回は、3つの企業の活用事例を紹介します。
伊藤園
「お~いお茶」などの人気商品を販売している伊藤園では、商品ラベルとCMで画像生成AIを活用しています。※1
商品ラベルでは、画像生成AIでデザインを生成し、その後デザイナーが手直しをしているそう。
生成AIは消費者の購買意欲を高めるデザインを生成することができます。生成AIは膨大なデータから学習しており、消費者を惹きつけたり商品の特徴を効果的に伝えたりできるデザインの情報が蓄積されているからです。
引用:https://www.itoen.co.jp/news/article/55683/
テレビCMでは、画像生成AIで生み出した「AIタレント」がCMに出演し、PRしています。※2
今まで企業は、俳優やタレントなどをCMに起用してきました。しかし、出演費やロケーション費など膨大な制作費を投じたにも関わらず、出演者の不祥事により放映できなくなるなどのリスクが多大にありました。
そのリスクをなくすために、AIタレントを起用する企業が増えてきています。
実際のCM映像はこちら
Googleは、Googleショッピング内で自分の体型や肌の色に近いモデルに洋服を試着させられる「Virtual try-on」(VTO)をアメリカでスタートさせました。※3
今や多くの人がECサイトで服を購入する時代。しかし、そこに写っているのは、自分と体型が違ったり、肌の色が違ったりするモデルです。自分が着た際のイメージがわかず、購入を諦めてしまったり、思い切って買ってみたはいいものの、結局合わなかったりという経験をされたことのある方も多いのではないでしょうか?
そこで、Googleはこれらの悩みを解消すべく、さまざまな体型、肌の色をした人間のモデルの写真を用意し、消費者が選択できるようにしました。そして、このモデルに検討している服を試着させられるのです。この試着をさせる段階で画像生成AIが活用されています。
現在はまだアメリカのみでの展開ですが、日本に上陸する日も近いのではないでしょうか。
株式会社mign
株式会社mignは、建築・土木領域で先端技術を活用するソフトウェア・ハードウェア開発を行っている会社です。
ChatGPTとStable Diffusionを使い、建築デザイン案を生成することで、建築デザイナーやプランナーのデザイン作成業務を効率化しています。※4
デザイン考案時の初期段階で活用することで、時間とコストを削減できたり、従来より多くの案を出すことができたりします。
まとめ
今回は、画像生成AIサービスとはどのようなものでどのような歴史を辿ってきたか、種類や特徴、さらには活用事例を紹介しました。
今後ますます進化していくであろう画像生成AIを、ぜひビジネスにおいても取り入れてみてはいかがでしょうか。
建設・土木業界向け 5分でわかるCAD・BIM・CIMの ホワイトペーパー配布中!
CAD・BIM・CIMの
❶データ活用方法
❷主要ソフトウェア
❸カスタマイズ
❹プログラミング
についてまとめたホワイトペーパーを配布中
※1:生成AIパッケージ「お~いお茶 カテキン緑茶」シリーズを、9月4日(月)より販売開始。同日より「カテポマイレージキャンペーン」をスタート|株式会社伊藤園
※2:AIタレントを起用した「お~いお茶 カテキン緑茶」のTV-CM第二弾!新作TV-CM「食事の脂肪をスルー」篇を、4月4日(木)より放映開始|株式会社伊藤園