音樂製作人用 AI 生了 130 首歌,只有 3 首能聽:人類為什麼覺得 AI 音樂無聊?

擁有 600 萬 YouTube 訂閱的音樂教育家 Rick Beato 實測 AI 音樂工具 Suno,產生約 130 首歌曲,僅 3 首達到可用水準。他與 Lex Fridman 的結論一致:AI 音樂缺少人類創作中的掙扎與靈魂,而聽眾正在快速學會辨別 AI 生成的內容。

音樂製作人用 AI 生了 130 首歌,只有 3 首能聽:人類為什麼覺得 AI 音樂無聊?

封面圖

本文整理自 Lex Fridman Podcast 2026 年 3 月播出的單集。

{{< youtube 1SJiTwbSI58 >}}

{{< spotify "episode/4s2oEc58Y3rHYJJHCnDJzf" >}}

{{< apple-podcast "tw/podcast/492-rick-beato-greatest-guitarists-of-all-time/id1434243584?i=1000752250848" >}}


130 首 AI 歌曲的實驗

Rick Beato 是 YouTube 上最具影響力的音樂教育頻道主持人,訂閱數超過 600 萬,曾擔任唱片製作人數十年。他在 Lex Fridman 的 Podcast 上分享了一個親身實驗:他用 AI 音樂生成工具 Suno 大量產出歌曲,搭配 Claude 來生成歌詞,因為 Suno 本身的歌詞品質實在不行。總共產出了大約 130 首歌曲構想,最後只有 3 首他認為算得上好。

2.3% 的成功率,出自一位擁有數十年製作經驗、對音樂品質有極高標準的專業人士之手。這個數字本身就值得深思。Beato 觀察到一個有趣的現象:AI 工具對優秀的詞曲作者來說反而更有用,因為他們有能力從大量產出中辨別哪些值得保留。換句話說,AI 生成的原始材料需要人類的品味來篩選,工具本身無法判斷好壞。沒有那個「品味濾鏡」,130 首和 0 首沒有差別。

秒辨 AI 音樂的下一代

更值得關注的是 Beato 孩子們的反應。他提到,他的小孩可以立刻辨別出一首歌是不是 AI 生成的。線索在哪裡?在人聲殘響和環境音的細微瑕疵裡。AI 生成的音樂在這些微觀層面有一種「不對勁」的質感,就像看 AI 圖片時總覺得哪裡怪怪的,只是換到了聽覺。人耳經過稍加訓練就能捕捉到這些訊號。

這個現象呼應了一個更大的趨勢:聽眾正在快速發展出偵測 AI slop 的能力。就像人們學會了從手指數量和文字扭曲來辨認 AI 生成的圖片,音樂領域的辨識力也在形成。Beato 和 Fridman 都認為,這種辨識力會越來越普遍。AI 生成內容想「混過去」的空間,只會越來越小。對做 AI 音樂產品的人來說,這是一個根本性的挑戰,光靠提高生成品質解決不了:人類聽眾天生在找「不真實」的訊號,而且越找越準。

一個音符就知道是誰

AI 音樂到底少了什麼?要回答這個問題,得先看看人類音樂家最珍貴的東西是什麼。在這集近三小時的對談中,Beato 花了大量時間談論史上最偉大的吉他手,從 Jimi Hendrix 到 David Gilmour 到 Mark Knopfler 到 Eddie Van Halen。他反覆回到一個核心觀點:偉大的吉他手不是彈得最快的那個人,而是只需要一個音符,你就知道是誰在彈。

這種辨識度來自獨特的音色(tone)、顫音(vibrato)和樂句風格(phrasing)。Pink Floyd 吉他手 David Gilmour 的旋律感天生自然,每一個樂句像說話一樣流暢地引向下一個,音符之間的留白和呼吸恰到好處。Dire Straits 的 Mark Knopfler 用手指撥弦而非撥片,從一個音符就能辨認出那把 Stratocaster 的音色。這些特質是數十年演奏經驗、個人身體結構、審美偏好共同塑造的結果,是一個人用一輩子活出來的聲音。

AI 可以模仿這些風格的表面特徵,但無法複製背後的形成過程。一個模型可以生成「聽起來像 Gilmour 的吉他獨奏」,但那只是統計模式的組合,缺少一個人類花了五十年磨出來的獨特聲音指紋。表面的相似和真正的獨特之間,差距比想像中大得多。

思考是 flow 的敵人

在談到 Miles Davis 時,Beato 引用了鼓手 Vinnie Colaiuta 的一句話:「思考是 flow 的敵人。」(Thought is the enemy of flow.)Beato 稱 Miles Davis 為爵士史上最偉大的創新者。他的小號技巧厲害嗎?當然。但真正讓他獨一無二的,是他站在從 bebop 到 cool jazz 到 modal jazz 到 fusion 每一次風格革命的最前沿。他的創作方式極其獨特:從不排練,從不回聽錄音。貝斯手 Ron Carter 甚至不知道自己的現場演奏正在被錄製。Davis 追求的是完全沈浸在當下的即興,任何預先計算的念頭都會破壞那種「腳趾懸在懸崖邊」的張力。

這恰好點出了 AI 音樂的根本矛盾。AI 生成音樂的過程全部是計算,是統計模式的組合,是從訓練資料中學到的機率分布。它沒有「沈浸在當下」的體驗,沒有冒險的感覺。而人類聽音樂時真正渴望的,正是聽到另一個人在冒險,在掙扎,在那個特定的瞬間做出了一個獨一無二的選擇。

工程工具,不是創作替代品

Beato 並不是全盤否定 AI 在音樂領域的價值。他特別提到 Isotope RX 這類音訊工程工具,用 AI 來做降噪、去除雜音、修復錄音品質,效果非常好。AI 在處理技術性工作時表現出色,因為這些任務有明確的正確答案:雜音就是要去掉,頻率就是要校準。

但當最終產出本身就是創作成品的時候,情況完全不同。Beato 和 Fridman 的共識是:當 AI 生成的東西是要直接呈現給人類欣賞的藝術品,而不是幫助人類創作的中間工具,聽眾會迅速失去興趣。這個判斷不只適用於音樂,它可能是所有 AI 創作領域的通則。AI 做為「輔助工具」很好,做為「創作者」就不行。差別在於,工具幫你解決技術問題,但創作需要的是一個有故事、有掙扎、有獨特經歷的人類。

人類做過最偉大的事

在對談接近尾聲時,Beato 說了一句話:「音樂是人類做過最偉大的事之一。創作音樂。」這不是場面話,而是一位花了一輩子研究、演奏、教學、製作音樂的人,在親手測試過 AI 能做什麼之後,依然這樣相信。

他的 130 首實驗告訴我們的不是 AI 不行,而是 AI 做出來的東西缺少了某種讓人類真正在乎的成分。那個成分可能是掙扎,是冒險,是某個人用一生的經歷塑造出的獨特聲音。這不是演算法能解決的問題。聽眾在乎的本來就不只是聲波的排列組合,而是那些聲波背後,有沒有一個真實的人。