AIによる画像生成ツールの比較と展望

2023.12.19

2023年現在、様々なメディアで取り上げられ注目を集めているのがOpenAI(1)が提供するAIチャットサービスであるChatGPT(2)や、Max Planckらが提供するAI画像生成ツールのMidjourney(*3)などのAI技術です。
これらのAI技術はIT化が進む現代において様々な業界で作業効率化やコスト削減に有効であるとされています。この記事ではその中でもMidjourneyなどのAI画像生成ツールの概要、課題、展望について解説していきます。

この記事でわかること
・現在のAI画像生成ツールの概要
・AI画像生成ツールの現状と課題
・AI画像生成ツールの展望

AI画像生成ツールとは

AI画像生成ツールとはユーザーが入力したテキストや画像をもとにAIが画像を生成するツールです。
一般的に、このツールには機械学習の手法の一つであるディープラーニング（深層学習）が用いられます。
ディープラーニングとは人間の脳内の神経細胞（ニューロン）のネットワーク構造を模した数学モデルであるニューラルネットワークを用いた学習法で、データに含まれる特徴を段階的により深く学習することができます。

現在ではツールによって生成される画像は、人間の手で描いたイラストや実際の写真と見間違えてしまうほどです。
ただし、現状では人の指が６本あったり、動物と人の体が混ざってしまった画像が生成されたりと、ユーザーが意図しない画像が生成されることもあるので注意が必要です。
失敗例はGoogleやMicrosof Edgeなどのブラウザで「AI画像生成　失敗例」と検索すると見ることができます。（ショッキングな画像が表示される可能性があります。検索する際は注意してください）

既存ツールの紹介と比較

現在、AIによる画像生成ツールは数多く存在しています。代表的なものとしてMidjourneyやStable Diffusion(4)、DALL・E2(5)などが挙げられます。
ここではこの３つについて紹介し、価格や実際の操作方法などについて比較していきます。

Midjourney

MidjourneyはMax Planckらが2022年7月にオープンベータ版を提供し、現在も人気のAI画像生成ツールです。
13歳以上であれば最低10ドルで1か月最大200枚、誰でも簡単にAI画像の生成することができます。コミュニケーションサービスであるDiscordを通じてテキストを入力することで、その文章やキーワードをもとに画像を生成してくれます。
以前は無料版も提供されていましたが、乱用やアクセス過多などの理由から2023年3月28日に停止となりました。

Stable Diffusion

Stable Diffusionは、英国のStability AI(*6)が開発、提供しているユーザーから入力されたテキストをもとに画像を生成する、画像生成AIモデルです。
利用方法は２つあります。Webブラウザ上のサービスを利用する方法と、PCにダウンロードしてローカル環境で利用する方法です。
Webブラウザ上で利用する際は以下の3つで気軽に使えるようです。

・Hugging Face
・Dream Studio
・Mage.space

無料で誰でも気軽にAIを用いて画像を生成できることが特徴です。

DALL・E2

DALL・E2も他2つと同様に、ユーザーから入力されたテキストをもとに画像やイメージを作成するAIツールです。
OpenAIが提供しており、1回のテキスト入力で1クレジットが消費され、そのクレジットを購入する形で利用する有料ツールです。
115クレジット単位で購入でき、価格は115クレジットで15ドルです。
2023年4月6日以前にアカウント登録したユーザーには、特典として登録時に50回分、毎月15回分の無料クレジットが付与されます。

AI画像生成ツールの活用方法

片手に収まるスマートフォンひとつで連絡、動画鑑賞、買い物など様々なことができるようになった現代。画像を扱うことはどのような業界、企業においても必要です。
そのような現状において、画像を素早く自動で生成できるAI画像生成ツールの活用場面は数え切れないほどです。
ここでは、AI画像生成ツールが活用されると考えられる場面を5つ紹介します。

1. アート制作・売買

AI画像生成ツールはテキストの入力や参考画像の入力などで手軽に画像を生成できることから、今まで高いデザインスキルを求められるような問題から諦めてしまっていた人々などがアート制作に利用しています。TwitterやInstagramなどのSNSで投稿したり、NFTアートとして売買しているケースもすでに存在するようです。

2. ロゴの作成

AI画像生成ツールを用いれば、ロゴも、テキストを入力するだけで作成することができます。
すでに紹介したMidjourneyであれば一つのプロンプトで4パターン生成することができるため、自分の理想のロゴを試行錯誤しながら以前より素早く作成することが可能です。

3. AI漫画

AI画像生成ツールは漫画を描くこともできます。
すでにRootport氏が画像生成AIを用いて描いた「サイバーパンク桃太郎」(*7)という漫画が新潮社から出版されています。

4. ゲーム開発における活用

ゲーム開発にはキャラデザインのイラストや背景のイラストなど様々な画像が必要になります。それらの作成をAI画像生成ツールによって自動化し、コスト削減や作業効率の向上が期待できると考えられています。

5. Webデザインの自動化

Webサイトの作成には、サイト全体のレイアウトやボタンやフォームなど、様々な視覚デザインが必要です。

作成方法は、自分で一からHTMLやCSSなどを用いて作成する方法やWordPress(*8)などのソフトウェアを使って作成する方法など様々です。
しかし、いきなりこれらを使って自分の理想のWebサイトを作成することは難しいと言えます。なぜなら自分の頭の中にしかないイメージに沿って作成することは、簡単ではないからです。
そこで画像生成AIを用いて自動で外見を生成することで、イメージを具体的にします。そうすることで、後はそれを上記の方法を用いて実現するだけでよくなります。

このように画像生成AIを導入することで、ゲーム開発と同様にコスト削減や作業効率の向上が期待できます。

AI画像生成ツールの課題

現在、AI生成系ツールの課題は数多く存在します。
その中で、画像生成AIは著作権に関する問題、データセットの量と質の問題、生成される画像の質の問題などを課題としています。
中でも、昨今著作権に関する問題はよく取り上げられており、様々なメディアでも議論されています。

米国では、今年1月に以下のような内容の集団訴訟が起こされました。
『画像生成AIが著作権を侵害したとして、アーティストたちが集団訴訟を起こした。Stability AI、Midjourney、DeviantArtの3社を相手どり、カリフォルニア州北部地区連邦地方裁判所に訴訟が提出されている。』(*9)
この訴訟を起こしたのはKarla Ortiz、Kelly Mckernan、そしてSarah Andersenの3名のアーティストであり、3者は自分たちの作品が画像生成AIの学習のためにコピーされ、その作品に由来していることが明らかなほど作品の要素を取り込んでいる派生作品の作成に利用されていることが理由だとしています。

このような問題はデータセットの量と質の問題にも関連すると考えられ、ツールを提供する企業等とデータを提供するアーティストとの連携が重要であると考えられます。
また、TwitterなどのSNSでは画像生成AIを用いたイラストを投稿したユーザーへの誹謗中傷も散見されており、今後大きな問題に発展する可能性もあります。

今後の展望

近年AIに関する研究は数多く行われています。今年3月22日にはMicrosoftの研究チームはChatGPT-4が人間のレベルに極めて近いとする論文(*11)を発表しています。そして、7月4日に米ライス大学と米スタンフォード大学に所属する研究者らはAI生成した画像（合成データ）を用いて別の生成モデルが学習し続けると、その精度にどのような影響がでるのかを検証した研究報告である論文を発表しています。

このような事から、AIに関する研究は今後も進められていくと考えられます。
しかし画像生成AIに限らず、その他のAIの学習に用いられているデータについての問題は未だ解決されていません。法律での規制や基準を作らなければデータの提供者（アーティストや作家など）とツールを提供する企業との間の軋轢は増える一方となります。

今後、私たちがより便利に気軽に生成系AIを利用していくためには、学習データの作成者にも目を向け、世界的な標準を作ることが最重要となるのではないでしょうか。