Meta MusicGenとは?オープンソース化で利便性向上!注意点も
画像認識AIや自然言語処理AIなどの商用化が進み、医療、金融、製造業、交通などさまざまな業界で、業務の効率化と精度向上が実現しています。
さらにオープンソースやクラウドサービスの普及により、誰でも容易にAI技術を活用し、革新的なアイデアを生みだす環境が培われています。
この記事では、Meta社が2023年に発表した音楽生成AI「MusicGen」の使い方や今後の活用が期待される分野、注意点について紹介します。
オープンソースの音楽生成AIが増加中
昨今、音楽生成AIはオープンソース化されるケースが増えています。
ここでは、生成AIの概要やオープンソース化する背景を見ていきましょう。
生成AIとは
生成AI(Generative AI)とは、指示したコンテンツを生成するAIのことです。
決められた行為を自動化するのではなく、データやパターンを学習することで、新しいコンテンツを生みだします。
そのため、生成AIの利用が特に有効なのは、新しいものを想像するクリエイティブな分野です。
アイデア段階で生成AIを活用すると、タスクの一部が自動化できます。
文章の作成やデザイン、製品を開発する際などに作業者の発想を補助することが可能です。
音楽生成AIとは
音楽生成AIとは、音楽のコードや楽典、楽曲の構造、音楽を聞いて人がどのように感じるかなど、さまざまな項目を学習して楽曲を生成する技術です。
大きくは曲自体を自動で生成する「自動音楽生成AI」と、既存の曲を編集や新曲を作るために必要なアイデアを提案する「補助的な音楽生成AI」の2つに分かれます。
1つのソフトウェアが両方のAIを搭載していることも少なくありません。
生成AIはオープンソース化されているものが多い
オープンソースとは、開発内容であるソースコードが公開され、誰でも自由に使用、改変、配布できるソフトウェアです。
あるソフトウェアがオープンソースになっていると、開発において非常に有効です。
AIの分野の開発では、オープンソースとして公開することより、加速度的な発展が期待されています。
AIの判断には、基準となる機械学習が欠かせません。
もし機械学習の基本的なアルゴリズムが公開されていれば、研究者や開発者などさまざまな人がそのAIモデルをみることができます。
世界中の開発者が自由にアイデアを共有、協力することで、バグの修正や新機能の開発、パフォーマンスの最適化など、オープンソースの全体的な品質向上が図れます。
また、学生や研究者がオープンソースのAIツールに触れれば、AIの概念の理解や実践的なアイデアの発想にも役立ちます。
つまり生成AIのオープンソース化は、技術の進歩を図るために活かせるのです。
Meta社の音楽生成AIとは
Meta社は、AI向けに最適化した次世代データセンターの設計など、さまざまな形でAIの進化に向けた計画を進めています。
Meta社の音楽生成AIのうち「Audio Craft」は2023年8月、「MusicGen」は2023年6月にオープンソース化しています。
Audio Craftの概要
Audio Craftとは、Meta社が開発しているテキストベースの音楽生成AIです。
それぞれオープンソース化されていて、3つの生成AIモデルから構成されています。
- MusicGen:テキストプロンプトやメロディーから音声を生成するAI
- AudioGen:テキストプロンプトから音声を生成するAI
- EnCodec:ニューラルネットワークベースのオーディオ圧縮コーデック
参考:Metaがオープンソースで公開したAudioCraftとは
Meta MusicGenの概要
Meta MusicGenとは、文章や既存のメロディーをもとに最大15秒の音楽を生成するAIです。
既存のメロディーは、口笛やハミング、歌、楽器での演奏などさまざまな要素が利用できます。
Meta MusicGenは、Googleの深層学習モデル「Transformer」をもとに開発されています。
機械学習用のトレーニングデータには、1万件の高品質な音楽トラックとShutterStock、Pond5の音楽データを合わせた2万時間のライセンス音楽を使っています。
Meta MusicGenは自己回帰トランスフォーマーモデルです。
ChatGPTと同じく、出力を次のステップの入力として利用することで長い出力に対応しています。
MusicLMとの違い
Meta MusicGenはGoogleの音楽生成AI「MusicLM」と比較されることがあります。
どちらも音楽を作るための生成AIですが、「MusicLM」の場合は比較的長いプロンプトを使って曲を生成します。
一方、Meta MusicGenは、簡単なキーワードや単語のみでも音楽の生成ができる点が異なります。
また「MusicLM」はベータ版の運用を拡大しているものの、日本ではまだ利用できません。
そのため、国内でGAFA提供の音楽生成AIを今すぐ試したい場合には、Meta MusicGenがおすすめです。
Music GENの使い方は?
Meta MusicGenは商用利用が可能
オープンソースであるMeta MusicGenは、作成した楽曲の商用利用が可能です。
また、Meta MusicGenで生成できる楽曲の長さは15秒です。
曲として見るとそれほど長くはないものの、いったん生成した楽曲をモチーフにしたりつなげたりすることで、作成できる楽曲の幅は非常に広くなります。
音楽生成AIの商用利用は、以下のようにさまざまな可能性が考えられます。
- エンターテインメント:映画、テレビ番組、ゲームなどのサウンドトラック
- 広告:ブランドのイメージやキャンペーンに合わせたジングル、バックグラウンドミュージック
- ホテル、レストラン、フィットネスなどのサービス業:顧客に合わせたBGM
- 教育:音楽の教材、学習者の関心を教材に向けるための音楽
- 個人利用:勉強用の集中力を高めるなど好みや目的に応じた楽曲
- 音楽療法:治療、リラクゼーション
- 音楽制作補助:作曲家がアイデアを形にするためのインスピレーション素材
音楽生成AIが発展すると、単に音楽を作るだけでなく、商用分野でも付加価値を提供するツールとして利用が期待されているのです。
Meta MusicGenと著作権の関係は不透明
Meta MusicGenで音楽を生成する場合、状況によっては既存の著作権に抵触する可能性があるため注意が必要です。
たとえば、サンプルに既存の楽曲を使用する場合、サンプルに使った楽曲が著作権で保護されていれば、無断での使用は著作権侵害になり得ます。
また、AIに学習させて生成された曲が類似したメロディーになっている場合、著作権で保護された既存の楽曲の「複製」と見なされる可能性があります。
さらに、問題なく楽曲を生成したとしても、 AIが生成した音楽の著作権は誰に帰属するのかが現時点では明確な定義がありません
一部には、AIによる創作物は「著作権のない作品」と見なすべきという主張があります。
しかしAI自体が著作者になるのか、またはAIを使って作曲した人が著作権を持つのか今後争われるケースが想定されます。
まとめ
Meta MusicGenは、オープンソースでデモ版が公開されています。
商用利用可能で最大15行の楽曲が作成可能です。
簡単な操作で楽曲が作成できるため、今後の多くの分野での活用が期待されています。
ただし、著作権と音楽生成AIとの関係ははっきりしていません。
技術革新とともに法整備が行われる可能性があるため注意が必要です。
大手ゼネコンBIM活用事例と 建設業界のDXについてまとめた ホワイトペーパー配布中!
❶大手ゼネコンのBIM活用事例
❷BIMを活かすためのツール紹介
❸DXレポートについて
❹建設業界におけるDX