Stability AI 最近推出了名為「Stable Audio」的新功能,利用最新的生成 AI 技術,透過簡單易用的網頁介面快速提供高品質的音樂和音效。該公司提供 Stable Audio 的基本免費版本,使用者可以生成並下載長達 20 秒的音軌,而「專業」訂閱則提供可商用下載的 90 秒音軌。
此外,音軌是根據使用者提供的文本提示 (Prompt) 以及所需的音訊長度生成。例如,使用者可以輸入“後搖滾、吉他、鼓組、低音、弦樂、興奮、提神、情緒化、流動、原始、史詩、感性、125 BPM” 等字詞,並要求一段 90 秒的音軌,系統會根據這些提示生成相應的音軌。
Prompt: Post-Rock, Guitars, Drum Kit, Bass, Strings, Euphoric, Up-Lifting, Moody, Flowing, Raw, Epic, Sentimental, 125 BPM
Stability AI 在一年前就曾經推出了名為 Dance Diffusion 的模型,該模型可以根據歌曲和音效的文本描述生成歌曲和音效。但在 Dance Diffusion 宣布後的近一年時間裡,就都沒有生成音訊的相關資訊。
現在,Stability 正在大力重新投入音訊領域。他們聲稱 Stable Audio 是第一個能夠通過一種稱為潛在擴散的技術,生成 “高品質” 44.1 kHz 音樂的工具。Stability 表示,Audio Diffusion 的底層模型提供了,比之前發布的生成音樂工具更大的控制內容和音訊長度的能力。
Stable Audio 的另一個特點是它可以生成長達 90 秒的音樂,而且這些音樂在整個長度上都是連貫的。這得益於所謂的潛在擴散技術,這是一種類似於 Stable Diffusion 用於生成圖像的技術。
Stable Audio 的推出可能會改變音樂創作和商用音樂的未來,但它是否能夠為 Stability 帶來商業成功仍然是一個問號。
資料來源:
討論區
目前尚無評論