Google Lyria 3:只要 30 秒,從文字或照片生成帶歌詞的音樂 - DigiLog 聲響實驗室

Google Lyria 3:只要 30 秒,從文字或照片生成帶歌詞的音樂

Google Lyria 3:只要 30 秒,從文字或照片生成帶歌詞的音樂
作者 by DigiLog 作者群 發布日期

Google 終於正式進場了。

2026 年 2 月,Google 在 Gemini 應用程式裡推出了 Lyria 3——一個可以把文字或圖片轉換成 30 秒音樂的 AI 生成工具。這不是實驗性功能,不是開發者預覽版,而是所有 Gemini 用戶(18 歲以上)都能直接使用的正式功能。

這件事的意義不只是「又多了一個 AI 音樂工具」。當全球最大的搜尋引擎、AI 研究巨頭決定把音樂生成整合進數億人每天使用的對話介面時,這代表 AI 音樂創作正式從「科技圈玩具」變成「主流工具」。

 

Lyria 3 是什麼?

Lyria 3 是 Google DeepMind 開發的第三代 AI 音樂生成模型,整合在 Gemini 應用程式裡。它的核心功能很直接:你輸入文字描述(或上傳圖片),AI 生成一段 30 秒的音樂,包含完整的編曲、人聲、歌詞和混音。

這不是 MIDI 音符生成,不是單純的配樂合成,而是從零開始創作一首「聽起來像真人做的」音樂。你可以指定曲風、年代、樂器、人聲特性、歌詞主題——甚至可以上傳一張照片,讓 AI 根據畫面情緒生成配樂。

最重要的是:這個功能完全免費,內建在 Gemini 應用程式裡,不需要另外下載軟體或付費訂閱(至少目前是這樣)。

 

Lyria 3 能做什麼?

Google 官方列出的使用場景包含以下幾種:

文字轉音樂:最基本的用法。你描述想要的風格、情緒、樂器,AI 生成對應的 30 秒曲目。例如:「一首帶有輕鬆搖擺節奏的獨立民謠,乾淨的木吉他、柔和的鋼琴,柔和的女聲輕唱著陰天遛狗的情景」。

圖片配樂:上傳照片或影片片段,搭配文字提示,AI 會生成符合畫面情境的音樂和歌詞。這個功能很適合為社群媒體短片、Vlog、IG Reels 快速配樂。

範本庫:Google 提供預設的音樂範本,你可以選一個範本當基礎,加入個人細節(例如朋友的名字、特定場合),AI 會客製化生成專屬版本。

聊天室主題曲:為群組對話創作「主題音樂」,然後分享給所有成員。這聽起來很搞笑,但確實是官方主打的使用場景之一。

客製化封面(Nano Banana):生成的音樂可以搭配 AI 生成的專輯封面,讓你的 30 秒小曲看起來更像一首「真的歌」。

 

如何寫出好的音樂提示詞?

Google 在官方頁面提供了一份「提示詞指南」,建議包含以下元素:

類型和年代:先定義音樂風格或混搭風格。例如:80 年代合成器流行樂、金屬樂與饒舌樂混搭、獨立民謠、經典鄉村樂。

節奏和韻律:設定音樂給人的感受和節拍風格。例如:輕快舞曲、慢板情歌、動感節奏。

樂器:指定特定音色或獨奏樂器。例如:薩克斯風獨奏、失真貝斯旋律、模糊的吉他聲。

人聲:描述歌手的性別、音質(音色)和音域。例如:空靈女高音、深沉男中音、沙啞搖滾歌手。

歌詞:說明歌詞主題或提供自己的文字。可以用結構標記(例如 [主歌 1]、[副歌])讓 AI 理解段落結構。

官方示範的完整提示詞範例:

「一首帶有輕鬆搖擺節奏的獨立民謠。樂曲特色為乾淨、充滿臨場感與細節的木吉他、柔和的鋼琴和輕快的打擊樂音。柔和的女聲輕唱著歌詞,描述陰天遛狗的情景。」

這個提示詞包含了類型(獨立民謠)、節奏(輕鬆搖擺)、樂器(木吉他、鋼琴、打擊樂)、人聲(柔和女聲)、歌詞主題(陰天遛狗)——基本上涵蓋了所有建議元素。

 

SynthID:Google 的 AI 音樂浮水印

Lyria 3 生成的所有音軌都會嵌入 SynthID——Google 開發的「隱形浮水印」技術。這個浮水印無法被人耳聽出,也不會影響音質,但可以被 Google 的檢測工具識別。

這代表什麼?

第一,你可以上傳一段音檔到 Gemini,問「這是不是 Google AI 生成的?」,Gemini 會檢查 SynthID 並回答你。

第二,即使音檔被重新編碼、壓縮、或經過簡單的後製處理,SynthID 仍然可以被檢測到(Google 聲稱這個浮水印具有一定的「抗干擾性」)。

第三,這是 Google 回應「AI 生成內容應該被標記」爭議的方式。他們不是在音檔的 metadata 裡加標籤(那很容易被移除),而是把標記嵌入音訊本身。

但這也引發了一些問題:SynthID 到底有多強?能抵抗多少程度的音訊處理?如果有人刻意想移除浮水印,要花多少力氣?Google 目前沒有公開這些技術細節。

 

Lyria 3 vs. Suno、Udio、Stable Audio

AI 音樂生成市場在過去一年爆炸性成長。Suno、Udio、Stable Audio 都已經推出類似功能。Lyria 3 進場,它的優勢和劣勢在哪裡?

優勢:整合在 Gemini 裡:這是最大的差異。Suno 和 Udio 都是獨立網站或 app,你需要另外註冊帳號、學習介面。Lyria 3 直接內建在 Gemini 對話框裡,不需要切換平台。對於已經在用 Gemini 的人來說,門檻幾乎是零。

優勢:圖片配樂功能:Suno 和 Udio 主要是文字轉音樂。Lyria 3 支援「上傳圖片+文字提示」生成配樂,這個功能目前還算少見。

優勢:SynthID 浮水印:Suno 和 Udio 目前沒有公開類似的浮水印技術。對於需要「證明這是 AI 生成」或「確保內容來源可追溯」的場景,Lyria 3 有優勢。

劣勢:30 秒限制:Suno 和 Udio 都可以生成 2-4 分鐘的完整歌曲。Lyria 3 目前只能做 30 秒片段。如果你想要一首完整的歌,Lyria 3 做不到。

劣勢:無法商業使用(可能):Google 的使用條款提到「須秉持負責任的態度創作」,但沒有明確說明商業使用的授權條款。Suno 和 Udio 的付費方案都明確允許商業使用。如果你想把 AI 音樂用在商業專案裡,Lyria 3 可能不是最安全的選擇(至少目前條款不夠清楚)。

劣勢:音質和創意控制:這需要實際測試才能比較,但從官方示範來看,Lyria 3 的音質和 Suno v4、Udio v2 應該在同一個等級。創意控制方面,Suno 和 Udio 都提供更細緻的參數調整(例如能量、變化度、人聲比例等),Lyria 3 目前看起來主要依賴自然語言提示。

 

誰適合用 Lyria 3?

Lyria 3 不是給所有人的,但對以下幾種人來說,它可能是最方便的選擇:

社群媒體內容創作者:如果你需要快速為 IG Reels、TikTok、YouTube Shorts 配樂,Lyria 3 的「圖片配樂」功能和 30 秒限制剛好符合這個需求。

Podcast 製作人:為 Podcast 片頭、片尾、轉場創作客製化音樂。30 秒對這些用途來說已經夠用。

簡報和教學影片製作者:為投影片、教學影片快速生成背景音樂。

遊戲開發者(原型階段):為遊戲原型快速生成音效或配樂的 placeholder。但正式版遊戲可能不適合用 Lyria 3(授權條款不明確)。

已經在用 Gemini 的人:如果你本來就在用 Gemini 寫文案、查資料、整理筆記,現在可以順便生成音樂,不需要另外開一個 app。

相反地,如果你需要完整長度的歌曲、需要明確的商業使用授權、需要精細的音樂參數控制,Suno 或 Udio 可能是更好的選擇。

 

爭議和限制

AI 音樂生成工具從來不缺爭議。Lyria 3 也不例外。

版權問題:Lyria 3 是用什麼音樂訓練的?Google 沒有公開訓練資料來源。如果訓練資料包含受版權保護的音樂,這是否構成侵權?這個問題在 AI 音樂領域仍然沒有定論,也是目前多起訴訟的核心爭議。

音樂人的工作機會:如果任何人都能用 AI 在 10 秒內生成「夠用的」背景音樂,那些靠製作 Podcast 配樂、YouTube 背景音樂維生的音樂人會受到衝擊嗎?這不是假設性問題,這已經在發生。

音樂的價值:當音樂變得「隨手可得」,它的價值會降低嗎?還是說,工具的普及反而會讓更多人有能力表達創意?這是哲學問題,沒有標準答案。

年齡限制(18+):Google 規定使用者必須年滿 18 歲才能使用 Lyria 3。這個限制的原因可能是法律風險考量(避免未成年人生成不當內容),但也限制了教育場景的應用。

 

這代表什麼?

Google 推出 Lyria 3,代表 AI 音樂生成正式進入「主流應用」階段。

兩年前,AI 音樂生成還是研究實驗室裡的專案。一年前,Suno 和 Udio 讓它變成獨立網站上的服務。現在,Google 把它整合進數億人每天使用的對話介面裡。

這不是說專業音樂製作會被 AI 取代——Lyria 3 生成的 30 秒音樂,品質和創意深度都還遠不及專業音樂人的作品。但「需要一段背景音樂」這件事,正在變得和「需要一張圖片」一樣簡單。

對音樂人來說,這可能是威脅,也可能是機會。威脅的部分是顯而易見的:低階的配樂工作確實會被 AI 取代。機會的部分是:當「夠用的音樂」變得免費且即時,真正有創意、有深度、有情感連結的音樂,價值反而會更高。

至於 Lyria 3 本身會不會成功?這取決於 Google 接下來的策略。如果他們持續改進功能、開放商業使用授權、延長生成長度,Lyria 3 有機會成為 AI 音樂市場的主流選擇。如果只是停留在「Gemini 的附加功能」,它可能只會是一個有趣的實驗。

但不管結果如何,AI 音樂生成這件事已經不可逆了。

 

官方示範影片

Google 官方發布的 Lyria 3 介紹影片,示範了完整的使用流程和生成效果:

 

引用來源

  1. Google Gemini Lyria 3 官方頁面

瀏覽次數 此文章被關注 360 次

討論區

目前尚無評論