AIによる画像生成ツールの比較と展望
2023年現在、様々なメディアで取り上げられ注目を集めているのがOpenAI(1)が提供するAIチャットサービスであるChatGPT(2)や、Max Planckらが提供するAI画像生成ツールのMidjourney(*3)などのAI技術です。
これらのAI技術はIT化が進む現代において様々な業界で作業効率化やコスト削減に有効であるとされています。この記事ではその中でもMidjourneyなどのAI画像生成ツールの概要、課題、展望について解説していきます。
この記事でわかること
・現在のAI画像生成ツールの概要
・AI画像生成ツールの現状と課題
・AI画像生成ツールの展望
AI画像生成ツールとは
AI画像生成ツールとはユーザーが入力したテキストや画像をもとにAIが画像を生成するツールです。
一般的に、このツールには機械学習の手法の一つであるディープラーニング(深層学習)が用いられます。
ディープラーニングとは人間の脳内の神経細胞(ニューロン)のネットワーク構造を模した数学モデルであるニューラルネットワークを用いた学習法で、データに含まれる特徴を段階的により深く学習することができます。
現在ではツールによって生成される画像は、人間の手で描いたイラストや実際の写真と見間違えてしまうほどです。
ただし、現状では人の指が6本あったり、動物と人の体が混ざってしまった画像が生成されたりと、ユーザーが意図しない画像が生成されることもあるので注意が必要です。
失敗例はGoogleやMicrosof Edgeなどのブラウザで「AI画像生成 失敗例」と検索すると見ることができます。(ショッキングな画像が表示される可能性があります。検索する際は注意してください)
既存ツールの紹介と比較
現在、AIによる画像生成ツールは数多く存在しています。代表的なものとしてMidjourneyやStable Diffusion(4)、DALL・E2(5)などが挙げられます。
ここではこの3つについて紹介し、価格や実際の操作方法などについて比較していきます。
Midjourney
MidjourneyはMax Planckらが2022年7月にオープンベータ版を提供し、現在も人気のAI画像生成ツールです。
13歳以上であれば最低10ドルで1か月最大200枚、誰でも簡単にAI画像の生成することができます。コミュニケーションサービスであるDiscordを通じてテキストを入力することで、その文章やキーワードをもとに画像を生成してくれます。
以前は無料版も提供されていましたが、乱用やアクセス過多などの理由から2023年3月28日に停止となりました。
Stable Diffusion
Stable Diffusionは、英国のStability AI(*6)が開発、提供しているユーザーから入力されたテキストをもとに画像を生成する、画像生成AIモデルです。
利用方法は2つあります。Webブラウザ上のサービスを利用する方法と、PCにダウンロードしてローカル環境で利用する方法です。
Webブラウザ上で利用する際は以下の3つで気軽に使えるようです。
・Hugging Face
・Dream Studio
・Mage.space
無料で誰でも気軽にAIを用いて画像を生成できることが特徴です。
DALL・E2
DALL・E2も他2つと同様に、ユーザーから入力されたテキストをもとに画像やイメージを作成するAIツールです。
OpenAIが提供しており、1回のテキスト入力で1クレジットが消費され、そのクレジットを購入する形で利用する有料ツールです。
115クレジット単位で購入でき、価格は115クレジットで15ドルです。
2023年4月6日以前にアカウント登録したユーザーには、特典として登録時に50回分、毎月15回分の無料クレジットが付与されます。
AI画像生成ツールの活用方法
片手に収まるスマートフォンひとつで連絡、動画鑑賞、買い物など様々なことができるようになった現代。画像を扱うことはどのような業界、企業においても必要です。
そのような現状において、画像を素早く自動で生成できるAI画像生成ツールの活用場面は数え切れないほどです。
ここでは、AI画像生成ツールが活用されると考えられる場面を5つ紹介します。
1. アート制作・売買
AI画像生成ツールはテキストの入力や参考画像の入力などで手軽に画像を生成できることから、今まで高いデザインスキルを求められるような問題から諦めてしまっていた人々などがアート制作に利用しています。TwitterやInstagramなどのSNSで投稿したり、NFTアートとして売買しているケースもすでに存在するようです。
2. ロゴの作成
AI画像生成ツールを用いれば、ロゴも、テキストを入力するだけで作成することができます。
すでに紹介したMidjourneyであれば一つのプロンプトで4パターン生成することができるため、自分の理想のロゴを試行錯誤しながら以前より素早く作成することが可能です。
3. AI漫画
AI画像生成ツールは漫画を描くこともできます。
すでにRootport氏が画像生成AIを用いて描いた「サイバーパンク桃太郎」(*7)という漫画が新潮社から出版されています。
4. ゲーム開発における活用
ゲーム開発にはキャラデザインのイラストや背景のイラストなど様々な画像が必要になります。それらの作成をAI画像生成ツールによって自動化し、コスト削減や作業効率の向上が期待できると考えられています。
5. Webデザインの自動化
Webサイトの作成には、サイト全体のレイアウトやボタンやフォームなど、様々な視覚デザインが必要です。
作成方法は、自分で一からHTMLやCSSなどを用いて作成する方法やWordPress(*8)などのソフトウェアを使って作成する方法など様々です。
しかし、いきなりこれらを使って自分の理想のWebサイトを作成することは難しいと言えます。なぜなら自分の頭の中にしかないイメージに沿って作成することは、簡単ではないからです。
そこで画像生成AIを用いて自動で外見を生成することで、イメージを具体的にします。そうすることで、後はそれを上記の方法を用いて実現するだけでよくなります。
このように画像生成AIを導入することで、ゲーム開発と同様にコスト削減や作業効率の向上が期待できます。
AI画像生成ツールの課題
現在、AI生成系ツールの課題は数多く存在します。
その中で、画像生成AIは著作権に関する問題、データセットの量と質の問題、生成される画像の質の問題などを課題としています。
中でも、昨今著作権に関する問題はよく取り上げられており、様々なメディアでも議論されています。
米国では、今年1月に以下のような内容の集団訴訟が起こされました。
『画像生成AIが著作権を侵害したとして、アーティストたちが集団訴訟を起こした。Stability AI、Midjourney、DeviantArtの3社を相手どり、カリフォルニア州北部地区連邦地方裁判所に訴訟が提出されている。』(*9)
この訴訟を起こしたのはKarla Ortiz、Kelly Mckernan、そしてSarah Andersenの3名のアーティストであり、3者は自分たちの作品が画像生成AIの学習のためにコピーされ、その作品に由来していることが明らかなほど作品の要素を取り込んでいる派生作品の作成に利用されていることが理由だとしています。
このような問題はデータセットの量と質の問題にも関連すると考えられ、ツールを提供する企業等とデータを提供するアーティストとの連携が重要であると考えられます。
また、TwitterなどのSNSでは画像生成AIを用いたイラストを投稿したユーザーへの誹謗中傷も散見されており、今後大きな問題に発展する可能性もあります。
今後の展望
近年AIに関する研究は数多く行われています。今年3月22日にはMicrosoftの研究チームはChatGPT-4が人間のレベルに極めて近いとする論文(*11)を発表しています。そして、7月4日に米ライス大学と米スタンフォード大学に所属する研究者らはAI生成した画像(合成データ)を用いて別の生成モデルが学習し続けると、その精度にどのような影響がでるのかを検証した研究報告である論文を発表しています。
このような事から、AIに関する研究は今後も進められていくと考えられます。
しかし画像生成AIに限らず、その他のAIの学習に用いられているデータについての問題は未だ解決されていません。法律での規制や基準を作らなければデータの提供者(アーティストや作家など)とツールを提供する企業との間の軋轢は増える一方となります。
今後、私たちがより便利に気軽に生成系AIを利用していくためには、学習データの作成者にも目を向け、世界的な標準を作ることが最重要となるのではないでしょうか。
まとめ
この記事では話題のAIによる画像生成ツールについて、代表的なツールから課題、今後の展望について解説しました。
AI技術により私たちの仕事はすさまじい勢いで変化していくと予想されます。
しかし法律や規制などの整備はまだまだ必要であり、その整備の内容によっては事業での導入が難しくなる可能性さえある現状です。未来のため、各国のAI技術に関する動向を把握し適切に利用していくことが重要であると言えます。
最新の情報、特にAI技術には目を光らせ、日々の生活や仕事に活かしていきたいところです。
大手ゼネコンBIM活用事例と 建設業界のDXについてまとめた ホワイトペーパー配布中!
❶大手ゼネコンのBIM活用事例
❷BIMを活かすためのツール紹介
❸DXレポートについて
❹建設業界におけるDX
■参考サイト
*1 OpenAI
*2 ChatGPT
*3 Midjourney
https://www.midjourney.com/home/?callbackUrl=%2Fapp%2F
*4 Stable Diffusion
https://ja.stability.ai/stable-diffusion
*5 DALL・E2
*6 Stability AI社
*7 サイバーパンク桃太郎
https://www.shinchosha.co.jp/book/772573/
*8 WordPress
https://ja.wordpress.org/
*9 アーティストたちが大手3社を相手に集団訴訟。画像生成AIは著作権侵害かフェアユースか?
https://artnewsjapan.com/article/698
*10 Sparks of Artificial General Intelligence: Early experiments with GPT-4
https://arxiv.org/abs/2303.12712
*12 Self-Consuming Generative Models Go MAD
https://arxiv.org/abs/2307.01850
*13 第3回 生成AIが著作権侵害などで訴えられる――人間の作品から学んで創る人工知能はクリエーターやジャーナリストの敵となるのか?
https://rp.kddi-research.jp/atelier/column/archives/1192
*14 【2023年最新】画像生成AIツール10選!注目されている理由や将来性についても紹介します
https://www.geekly.co.jp/column/cat-technology/ai-image-generator_tools/
*15 AI画像生成ツールとは?おすすめの16選+αを紹介【アプリあり】
https://n-v-l.co/blog/what-is-ai-image-generation-tool
*16 ディープラーニング これだけは知っておきたい3つのこと
https://jp.mathworks.com/discovery/deep-learning.html
*17 【おすすめ8ツール比較】画像生成AIとは?活用事例や問題点を解説!
https://camerawokamaete.com/0127-ai-gazouseisei-matome/#index_id1
*18 GAFAも参入!加速する「AI半導体チップ」開発競争
https://wealthroad.jp/archives/7397