AMAZON でお買物

誰でも作曲家時代が到来? Stability AI、スマホだけで音楽を作れる”神AI”をついに解禁

AI

朝の通勤電車、ふと頭に浮かんだメロディ。
しかし、録音する手段も、作曲するスキルも、機材もない。
そうしてその音は、二度と戻らないまま、雑踏に消えていきました──。

そんな経験、ありませんか?

音楽や音声を「作る」という行為は、ずっと「選ばれた人」だけのものでした。
でも今、AIの力がその”当たり前”を静かに、しかし確実に変えようとしています。

2025 年5月14日、AIスタートアップの旗手 Stability AI は、新しい音声生成モデル「Stable Audio Open Small」を発表しました。
しかも驚くべきことに、このモデルはスマートフォン1台で動くのです。
これは、Stability AI とプロセッサメーカー Arm 社の協力により実現しました。

これは単なる新技術の話ではありません。
これは「音で表現する自由」が、誰にでも届くようになる未来の始まりです。

AIが”音を描く”時代へ。Stable Audio Open Small の正体

新たに公開された Stable Audio Open Small は、3億 4100 万のパラメータを持つ、市場最速クラスの音声生成AIモデルです。

このモデルは Arm CPU に最適化されており、スマートフォンでわずか8秒以内に最大11秒の音声を生成できます。
短いオーディオサンプルや効果音、例えばドラムやインストゥルメンタルのリフなどの生成に特化しています。
この技術により、思いついたサウンドアイデアを、その場ですぐに形にすることができるのです。

現在、多くの音声生成AIアプリ(Suno や Udio など)はクラウド処理に依存していますが、Stable Audio Open Small はオフラインでの使用が可能です。
これは、音の創造が”場所”や”ネットワーク”という制約から解放される、歴史的な転換点かもしれません。
地下鉄の中でも、山奥のキャンプ場でも、インスピレーションが湧いた瞬間に音を生み出せる──そんな自由が、私たちの手の中にあるのです。

ロイヤルティフリーの扉──音の民主化が進む

さらに注目すべきは、このモデルの訓練データが、Free Music Archive と Freesound のロイヤルティフリーの音源のみで構成されていることです。
これは、著作権侵害のリスクを回避した倫理的なアプローチです。
多くの競合サービスが著作権問題で議論を呼ぶ中、Stability AI は「クリーンなデータ」にこだわり、持続可能な音楽生成の道を選んだのです。

利用条件も興味深い構造になっています。
研究者や趣味の利用者、そして年間収入 100 万ドル未満の企業は無料で使用できます。
一方、年間収入 100 万ドル以上の開発者や組織はエンタープライズライセンスが必要となります。
この段階的なライセンス体系により、個人クリエイターや小規模スタートアップには門戸を広く開きながら、大企業からは適切な対価を得るという、バランスの取れたビジネスモデルを実現しています。

「音のAI」、私たちの暮らしをどう変える?

Stable Audio Open Small は、単なる技術革新にとどまりません。
これは”自分の声”を音で持つことができるようになるツールです。

想像してみてください。
動画制作の効果音がオフラインで自動生成できる世界を。
YouTuber や TikToker が、ネット環境を気にせずに、その場で必要な効果音を作り出せるのです。
短いジングルやサウンドエフェクトを即座に作成し、コンテンツの品質を大幅に向上させることができます。

また、モバイルアプリでリアルタイムに音声を生成できることで、新しい表現の可能性が広がります。
日記アプリに感情に合わせた BGM を自動でつけたり、プレゼンテーションに最適な効果音を瞬時に作成したり。
音は単なる装飾ではなく、感情を伝える新しい言語になっていくでしょう。

ただし、現時点では技術的な制限も存在します。
英語のプロンプトのみのサポートという言語の壁があり、リアルな人声や高品質な歌の生成はまだ不可能です。
さらに、西洋音楽に偏った性能という課題もあります。
これは訓練データの偏りによるもので、多様な音楽文化を完全に表現するには、まだ改善の余地があります。

音はもう「選ばれた人のもの」じゃない

長らく、音を創るには知識、技術、そして道具が必要でした。
でも今、それらの壁が次々と取り払われようとしています。

Stable Audio Open Small は、その扉を開く”鍵”のひとつ。
制限はありますが、スマートフォンでオフライン音声生成を可能にするこの技術は、誰かの「心の声」を音に変え、世界に響かせる最初の一歩になるはずです。

音楽スタジオに行かなくても、高価な機材を買わなくても、専門的な知識がなくても、あなたの想像力を音として表現できる時代が来ました。
それは、人類の創造性の新しい章の始まりかもしれません。

音楽の未来は、あなたのポケットの中にある。
さあ、あなたの”声なき音”を、世界に聴かせてみませんか?

参考:Stability AI releases an audio-generating model that can run on smartphones

コメント

タイトルとURLをコピーしました