Googleが開発した音楽ジェネレーター「MusicLM」とは
新スタートレックというSF作品の中で、アンドロイドである「データ」は人間性を理解するため、絵を描いたり楽器を演奏するなどの芸術活動にチャレンジしています。データのキャラクターを象徴するエピソードですが、実は現実世界でもAIによる音楽制作が可能になってきました。
今回の記事では、Googleが発表した音楽ジェネレーター「MusicLM」について取り上げていきましょう。
この記事でわかること
・Googleが発表した音楽ジェネレーター「MusicLM」について
・芸術分野で実用化されているAIについて
・AI作品に関する著作権問題について
Googleが発表した音楽ジェネレーター「MusicLM」
「MusicLM」は、入力された単語や文章に応じて、音楽を生成できるAIモデルです。
これまでの同様なモデルに比べ、遥かに精密かつ幅広いバリエーションで音楽の生成ができる特徴があります。
のべ28万時間もの音楽データセットでトレーニングされており、MusicLMのサイトでは生成された音楽のサンプルが公開されています。
例示されたテキストと生成された音楽は次のようなものです。
<テキスト>
The main soundtrack of an arcade game. It is fast-paced and upbeat, with a catchy electric guitar riff. The music is repetitive and easy to remember, but with unexpected sounds, like cymbal crashes or drum rolls.
<日本語訳>
アーケードゲームのメインとなるサウンドトラック。キャッチーなエレキギターのリフがあり、ペースが速くアップビートです。
音楽は反復的で覚えやすいですが、シンバルのクラッシュやドラムロールなどの予想外の音が含まれています。
<生成された音楽サンプル>
生成されたサンプルを再生してみると、確かにアーケードゲーム風のよくある旋律が流れてきます。
いくつもの学習用データから「アーケードゲーム風」の典型的な旋律を学び、新たな音楽を生成した上で、人間が聞いてもおかしくないようバランスを取る。おそらくそんな仕組みなのでしょうが、前後関係が破綻せずちゃんとした音楽として成立しているのには驚きです。
さらに、細かい要求を全て満たした上でと言うのですから、短期間で大量に典型的な音楽が必要とされるような場面において、活用される未来も遠くはないでしょう。
とは言うものの、最初の1フレーズで惹きつけられるような優れた音楽ではありません。まだまだオリジナリティと言う部分では、人間のクリエーターには敵わないようです。
「MusicLM」では、多種多様な指示の仕方が選択できます。例えば、時間経過ごとに異なる指示をした上で、一連の音楽として成立させることも可能です。
<指示の例>
electronic song played in a videogame (0:00-0:15)
meditation song played next to a river (0:15-0:30)
fire (0:30-0:45)
fireworks (0:45-0:60)
<日本語訳>
ビデオゲームで演奏されるエレクトロニックソング(0:00-0:15)
川のそばで演奏される瞑想の歌(0:15-0:30)
火(0:30-0:45)
花火(0:45-0:60)
<生成された音楽サンプル>
また元となる音楽リソースを、異なる音色で表現することも可能です。
<指示の例①>
モーツァルト 交響曲第25番 口笛
<生成された音楽サンプル>
<指示の例②>
モーツァルト 交響曲第25番 アカペラコーラス
<生成された音楽サンプル>
他にも、有名画家が描いた絵画とその説明文から音楽を生成する、といったこともできます。外見的にはまるで「絵画からインスピレーションを得て作曲する」ように見えます。
もちろんAIですから、インスピレーションではなく、アルゴリズムがそれを実現しています。
<指示の例>
絵画:ムンクの「叫び」
説明文:ムンクが自然の中で悲鳴を感じたり聞いたりしたという幻覚体験に触発され、パニックに襲われた生き物が死体のようであると同時に精子や胎児を連想させ、血のように赤い空の渦巻く線に輪郭が反響している様子を描いています。
<生成された音楽>
さらにアコースティックギターやチェロなど楽器の指定、初心者ピアノ奏者といった演奏者のスキルレベルの指定、カリブ海のビーチなどシチュエーションなどの指定が可能です。
もはや、何ができないの?といったレベルで様々な指定ができ、それに応じた音楽サンプルが紹介されています。
「歌」に聞こえる音声もありますが、意味のないでたらめな単語であり、あくまで「それっぽく聞こえるだけのものです。
この辺りも例えば「Chat GPT」などと組み合わせて、歌詞自体をAIが作成しそれに音楽をつけるといったこともできそうです。作詞作曲も全てAIで実現できる時代になってしまいました。*注2
AI作品に関する著作権問題
この「MusicLM」ですが、実際に自分でも試してみたいと思うのですが、Googleの研究チームはサンプルだけを公開しており、私たちが直接操作することはできません。これは著作権や倫理的な問題を、まだ完全に解決していないことが原因です。
Googleによると、生成された音楽サンプルの一部に、テストデータとして利用した音源がそのまま使われていることがあるとのことです。著作権法上問題となる事案でしょう。
人間が同じようなことをおこなうと、「パクリ」や「盗作」になってしまいます。もう少しオリジナリティが発揮できるようになるまでは、ブラッシュアップが必要です。
また、このような問題をクリアできたとしても、一般のユーザーが自由に利用できるようになると、別の問題が生じてきます。
例えば私が「MusicLM」を利用して作曲をしたとして、これは私のオリジナル作品として主張できるのでしょうか?著作権は私が主張して良いのでしょうか?
明確な回答はまだ存在しません。
さらに学習用データとして利用された膨大な数の音源を作成した人には、なんの権利もないのでしょうか?
作成された音楽に学習用データがどのように反映されているのか?それを明確に追跡することはもはや不可能でしょう。しかし、確実にAIの能力に影響を与えているはずです。
人間であればそれは「学習」であり、過去の有名作曲家の作品に影響され、刺激されて新たな音楽を生み出すことは普通です。一人の偉大な先駆者が編み出した音楽スタイルが一つの分野として成長し、確立するのも「スタイルの模倣」から始まります。
しかしAIが先駆者のスタイルを模倣し、大量の音楽を安価かつスピーディに作成するとなると、人間のケースとはまた異なる配慮が必要となってきます。
日本では、「学習用として利用された画像については、著作権上の権利を気にしなくとも良い」という法律がすでに成立しています。これは2019年の改正著作権法で、明記されました。
これから「MusicLM」のような音楽生成ジェネレーターについても、世界各国で著作権上の整備がされていくものと予想されますが、この点について日本はすでに「整備済み」と言えるでしょう。
ただし、改正著作権法が成立した時点で、音楽データについても想定されていたのかどうかは不明であり、今後なんらかの見直しが進む可能性も否定できません。*注3
芸術分野で実用化されているAI
これまでコンピューターの得意分野は「大量のデータ処理・計算をスピーディかつ正確に処理する」ことでした。そこにオリジナリティはなく、音楽や絵画といった芸術分野は人間に敵わない、はずでした。
もちろん前述した通り、AIに独自の発想や着想などのオリジナリティはありません。あくまでも膨大なデータ処理と、機械学習を活用した分析・類推による「模倣」に過ぎません。
しかしその精度・クオリティは、もはや一見して人間の創作活動との区別が難しい水準にまで進化しています。
「Stable Diffusion」や「Midjourney」といった画像生成AIから、自然言語に対応した文章の要約や質問への回答から、オリジナル小説の作成までできる「ChatGPT」まで、様々なAIが登場しています。
例えば、自撮り画像をアニメ風の絵柄に変換してくれるアプリなど、すでに私たちの身近なところにも利用され始めています。
非常に便利な機能であり、うまく利用すれば人間の創作活動をサポートしたり、エンターテインメントをこれまで以上に活発にするなど利点も多いのですが、前述した著作権の問題やトレパクなど新たな課題も生じています。
今後、このようなAIに合わせた法整備とともに、新たなリテラシーの確立が重要となってくるでしょう。*注4
【まとめ】
今回ご紹介した音楽ジェネレーター「MusicLM」以外にも、画像ジェネレーターなどAIを活用した新たなシステムが多数実用化されています。
人間の創造性やオリジナリティとAIとの関係がどうなるのか。これから数年間は様々な問題が議論され、検討されていくことでしょう。
いよいよ本格的なAIを活用した新たな時代へと歩み始めた。そんな想いに期待を膨らませながら、今回の記事を終えることにしましょう。
大手ゼネコンBIM活用事例と 建設業界のDXについてまとめた ホワイトペーパー配布中!
❶大手ゼネコンのBIM活用事例
❷BIMを活かすためのツール紹介
❸DXレポートについて
❹建設業界におけるDX
▼キャパの公式Twitter・FacebookではITに関する情報を随時更新しています!
■参考文献
注1 音源引用先
MusicLM: Generating Music From Text
https://google-research.github.io/seanet/musiclm/examples/
注2
PC Watch 「Google、文章から音楽を生成するAI「MusicLM」」
https://pc.watch.impress.co.jp/docs/news/1474140.html
Gigazine 「Googleが入力したテキストから自動で作曲するAI「MusicLM」を開発」
https://gigazine.net/news/20230130-google-ai-musiclm/
Google Research ”MusicLM: Generating Music From Text”
https://google-research.github.io/seanet/musiclm/examples/
注3
Tech Crunch 「Googleはテキストの説明から音楽を生成できるAIを作成しましたが、リリースしません」
Techno Edge 「Google、文章から音楽を生成するAIツール「MusicLM」発表」
https://www.techno-edge.net/article/2023/01/29/777.html
「CNETのAI生成記事、「半数以上に誤り」と認める。見直し後に再開の意向」
https://www.techno-edge.net/article/2023/01/26/763.html
ASCII 「AIの著作権問題が複雑化」
https://ascii.jp/elem/000/004/124/4124486/4/
「赤松健氏「画像生成AI、珍しく日本が勝つチャンス」」
https://ascii.jp/elem/000/004/122/4122855/3/
「「AIトレパク」が問題に」
https://ascii.jp/elem/000/004/121/4121719/
注4
Gigazine 「キーワードに沿ってまるで人間が描いたような絵や写真を生み出すAI「Stable Diffusion」が一般公開されたので使ってみた」
https://gigazine.net/news/20220823-stable-diffusion-public-release/
「風景写真家がAI画像ジェネレーター「Stable Diffusion」で非実在美景を生成」
https://gigazine.net/news/20220819-beautiful-landscapes-created-by-stable-diffusion/
「まるで人間のアーティストが描いたような画像を生成するAIが「アーティストの権利を侵害している」と批判される」
https://gigazine.net/news/20220815-stable-diffusion-controversy-ai-infringes-artists/