每每關於人工智慧 (AI) 的新消息,演進的技術面向都讓人驚艷,DigiLog 也一直持續推出與關注人工智慧在音樂上使用,並推出相關文章,像是今年 (2018) 三月“ Google 跨過界?!推出以機器學習和類神經網路為概念的合成器 - NSynth Super ” 一文與近期 “ 我的合作夥伴不是人類 - 淺談 Ash Koosha 與 AI Yona 聯手打造專輯 “Return 0” ”一文,兩篇文章驗證了即便都是在音樂領域中,人工智慧相關項目被使用的方式仍然有許多變化。
新版 Sound Search
近期,Google的人工智慧部落格,由 James Lyon 釋出下個時代的音樂辨識 (Google’s Next Generation Music Recognition),推出新版本的 Sound Search,可以在任何 Android 手機上,透過 Google 探索應用或 Google 智能助理,打開時則會彈出 “這首歌是什麼?” 的建議按鈕,或是可以直接用語音問:“谷歌,這首歌是什麼?”,搜尋附近正在播放得音樂!對了,記得打開語音查詢才能使用喔。
新的 Sound Search 是奠基於 Now Playing 的技術,2017年時,Google 在Pixel 2上推出了Now Playing,特色是使用深度神經網絡為移動設備,因此大大降低耗能,不會對電池造成明顯影響。在開發時,Google 致力於創建一個小型、高效的音樂識別器,只需要數據庫中非常小的音樂指紋 (fingerprint),而且不需要連結網路,也以辨識音樂,而且還大大超過舊的sound search的準確性和效率。
舊版sound search 的操作範例
概要的技術原理
新的系統使用卷積神經網絡,取僅幾秒鐘的聲音轉換成一個獨特的“指紋”,也就是成為一種音樂識別特徵,然後將這個“指紋”與存放數萬首歌曲的數據庫進行比較,數據庫會定期更新,添加新發布的曲目,還會刪除不那麼受歡迎的歌。搜尋的流程分兩個層級,第一階段,用快速搜尋整個資料庫的方式,找出可能歌曲成為候選曲目,再將這些歌丟到第二階段,針對候選曲目進行詳細分析,進而找出正確的歌。 Sound Search 目前最大的挑戰是歌曲數量的千倍,可能會產生誤報結果,再不改其他變因的情況下,必須增加識別閾值,也就是說增加音頻的長度,但是讓人們等待10秒以上是不被允許的。
其他家音樂辨識
除了google,市面上也出現了許多辨識音樂、找歌曲的軟體,像是像是 SoundHound、被蘋果收購的 Shazam,另外KKBOX也有提供音樂辨識的工具,還特別點出哼唱辨識,自己唱出來讓機器去尋找曲目。現在有那麼多的的辨識音樂工具,相信以後沒有人會再是找音樂的苦主了!
參考資料:
https://ai.googleblog.com/2018/09/googles-next-generation-music.html
討論區
Wu Sean
2 年多前吃