對抗向平庸的引力:AI 讓人人能寫 7 分作品,Stripe 設計總監告訴你 10 分要怎麼來
AI 讓設計變容易,所以更容易把 7 分作品交出去。Stripe 設計總監凱蒂.蒂爾在 Y Combinator 訪談裡丟出一個說法:對抗向平庸的引力。她解釋為什麼一張 AI 生圖能讓內部 Slack 串吵半天、為什麼要把 MVP 改成 MVQP,以及『走過店面』這個 Stripe 每週五全公司一起做的紀律,怎麼支撐起 AI 時代的設計品質。

本文整理自《Y Combinator Startup Podcast》Design Review 系列 2026 年 4 月 22 日播出的單集,YC 合夥人亞倫.艾普斯坦(Aaron Epstein)訪問 Stripe 設計總監凱蒂.蒂爾(Katie Dill),談 stripe.com 一年改版背後的決策、AI 怎麼進入她的設計流程,以及她為團隊定下的核心紀律:對抗向平庸的引力。本篇聚焦在後半段的設計哲學。
{{< youtube ypzNhwpmOD4 >}}
{{< apple-podcast "tw/podcast/stripe-head-of-design-katie-dill-breaks-down-their/id1236907421?i=1000763073781" >}}
一張 AI 生圖,吵了一條長長的 Slack 串
蒂爾在訪談裡提到一個讓人印象深刻的內部故事。Stripe 新首頁有一個區塊叫 Bento,是把 Stripe 旗下幾十項產品挑出 6 個放進方格裡呈現,每一格都搭配一張為那家客戶量身做的視覺。其中一張,是把 Stripe 的平行四邊形商標跟一個冰塊的意象結合起來,AI 工具大概兩個小時就生出來了,看起來像專業攝影棚拍出來的。
按照舊的設計流程,這張圖光是找攝影師、約棚、找道具、後製,可能要兩到三週。AI 把這個成本壓到接近於零,速度快得讓設計師都還來不及反應。蒂爾講這段時的語氣是讚嘆的,但她接著補的那句話才是重點:「然後我們團隊就為這張圖在 Slack 上吵了好幾天。」
整條 Slack 串吵的不是大方向,是細節。冰塊裡的氣泡看起來不像氣泡,是攝影學那種「氣泡折射光線的方式不對」的不像。手伸出來的角度怪,影子的方向跟光源不一致,平行四邊形的邊緣有一條很微弱但看得出來的鋸齒。這些細節分別來看都不嚴重,但加起來會讓一個夠細的觀者感覺「這張圖有點假」。Stripe 不能接受這種感覺,因為 Stripe 整個品牌資產就靠「值得信任」三個字撐著,一張感覺有點假的圖會傷到那三個字。
「AI 是把地板拉高了,但屋頂還是要靠人。」蒂爾用這句話總結這個故事。AI 解了 90% 的問題,剩下的 10% 才是手藝、是品味、是逐個像素的注意力。她在訪談裡強調得最重的一句是「每一個像素基本上都需要同樣的關注」(each pixel basically needs the same amount of attention),這句話聽起來像口號,但對於每天跟 AI 工具打交道的設計師來說是一個很具體的提醒:當 AI 把某個任務變得異常容易,不要被這個容易感誘惑住,要回過頭問自己「這真的夠好嗎?」
為什麼 AI 反而讓平庸變得更危險
AI 工具讓設計師的產能上限拉高到一個前所未有的位置。她舉了一個具體的數字:「過去要花相同時間看兩個版本的提案,現在我們可以看 20 個。」這個倍率不只是效率提升,是設計探索的本質改變。一年前還要花一週做的 wireframe 比稿,現在一個下午就能跑完。一年前還要約客服訪談才能知道的使用者反應,現在用 AI 把同一段文案換成 5 種不同人物的口吻就能先預覽。
但效率提升有一個常被忽略的副作用:當輸出 7 分作品變得異常容易,把 7 分當作可以接受的品質就變成日常。這就是蒂爾講的「向平庸的引力」(gravitational pull to mediocrity)。每一個「夠好了,先這樣」的決定本身都不嚴重,但這些決定會在組織裡複利累積。一個 7 分的版本、一個 7 分的元件、一個 7 分的流程,加起來就是整個產品的 7 分。
這個壓力在 AI 之前就存在,但 AI 把它放大了好幾倍。原因很簡單:在 AI 之前,要把作品做到 7 分本身就很辛苦,你必須投入大量時間,這個時間成本本身就是一道篩選。一個工程師寫了三天的程式才寫出 7 分的東西,他通常會多花一兩天再優化到 8 分。但現在 AI 三十分鐘就把你帶到 7 分,剩下的時間是花在優化、還是丟給下一個任務?多數人會選後者,因為下一個任務也只要三十分鐘就能交出 7 分。
這個現象她用一個很犀利的角度描述:「如果你連這個小事都讓它過去了,下一件事你還會堅持嗎?再下一件呢?這個複合起來會是什麼樣子?」她不是在講完美主義,是在講一種紀律性。一個能持續產出卓越作品的組織,靠的不是某幾個天才設計師的靈感爆發,而是組織裡每一個人對「7 分不夠」這件事的共識。卓越的公司之所以稀有,是因為這個共識太難維持。
「不要為了不傷團隊感情而放它過去」
訪談裡她花了一段特別講一個觀察到的微妙心理:很多時候人們選擇接受 7 分作品,不是因為他們真的覺得 7 分夠了,而是因為團隊已經為這個版本投入了大量心力,現在改的話會傷到那群人的感情。這個心理在每個有經驗的管理者腦海裡都響過。
她的反駁很直接:「但如果產品最後就只是普普通通,這個團隊真的會比較開心嗎?」這句話把整個沉沒成本的邏輯扳回來了。團隊辛苦做出來的東西,如果上線之後使用者的反應是「還行」,這份還行對團隊的傷害遠比現在再修一輪要大得多。多數設計師當初選這份工作,要的就是看到自己做的東西被使用者真心讚嘆的那一刻,把這個讚嘆換成「還行」是對團隊真正的不公平。
這個道理推到組織管理層面,就變成一個關於「主管要不要當壞人」的問題。蒂爾沒有用這個詞,但她描述的情境就是這個問題。當一個版本送到主管桌上,明明可以更好但團隊已經疲憊不堪,主管當下說 OK 是最容易的選擇。可是這個選擇會在團隊裡建立一個訊息:我們的標準只到這裡。半年之後團隊整體的天花板就在這裡。
對抗這個誘惑,蒂爾建議的方法是把「不要讓這個過去」(do not leave well enough alone)當成一個明確的口頭禪。這四個英文字短到可以隨時在會議室講出來,當成一個共同的紀律提醒。它不是要把團隊推向完美主義的另一個極端,是要把那條「夠好」的線守在一個比直覺更高的位置。
Prototype, don't present:別用解釋的,讓他們直接體驗
訪談中段聊到設計師跟 stakeholder 的互動,蒂爾丟出另一個她常掛在嘴邊的口號:「Prototype, don't present.」(做原型,不要做簡報。)這句話翻成白話就是:不要花時間用嘴巴解釋你的設計取捨給高層聽,直接讓他們像使用者一樣去用那個原型,他們的反應會比你解釋的版本更接近真實。
這個建議背後有一個關於人類認知的觀察。當設計師坐在會議室裡用簡報解釋「我們把這個按鈕從藍色改成綠色,因為 A/B test 顯示綠色點擊率高 8%」時,stakeholder 接收到的是「這個團隊做了一個合理的決定」,他們不會真的感受到那個按鈕被使用的瞬間是什麼感覺。但如果你把原型開在他們面前,請他們完成一個任務,他們會在用的當下卡關、流暢、開心或困惑,這些反應會比你準備好的論述更有資訊量。
這個邏輯她推到一個很狠的位置:對 stakeholder 來說,唯一值得問的問題是「這個產品在使用者的一天裡感覺起來怎麼樣?」其他所有的權衡分析、技術細節、數據佐證,都不如讓他們直接體驗。這個轉變其實對設計師有解放性,因為它讓設計師從「說服別人」這個沒完沒了的任務裡解脫出來,回到「把產品做好」這個更核心的工作。
當然,做原型本身需要時間,過去這個時間成本讓「直接做原型」變成奢侈品。但 AI 工具把這個成本壓低到一個臨界點以下了。今天用 v0、Lovable、Cursor 這類工具,一個設計師可以在幾小時內把一個會議要討論的設計做成可以點擊的原型。這個能力把蒂爾的這句口號從理想變成可以日常執行的方法。
上線前要自問的三個問題
從原型到上線中間,蒂爾用了一個她自己的權衡框架。每次要決定一個有爭議的設計或功能該不該上線,她會問三個問題:第一,這會不會對某個人的一天造成負面影響?第二,這會不會侵蝕使用者對我們的信任?第三,這如果出錯,會不會變成隔天的頭條新聞?
這三個問題的設計很聰明。第一個是日常使用的風險,幫助篩掉那些「對使用者來說只是 0.5 分但對我們團隊很方便」的決定。第二個是品牌的長期資產,把那種「一次小違規不會被注意到」的僥倖心理擋下來。第三個是公關層面的災難性風險,逼設計師想清楚最壞情況是什麼。
這三個問題加起來組成一個過濾器。它的厲害不在於每個問題本身有多深奧,而在於把它們依序問一遍會強制設計師跳出當下的執行壓力,從不同的時間尺度看同一個決定。把這三個問題當成 Stripe 設計團隊的內建檢查表,意味著任何一個準備上線的東西都至少被這三個維度掃過一次。
但她立刻補上反向的提醒:不能反過來變成完美主義的藉口。訪談裡用了一個很實在的句子:「你的產品,只有真的上線給人用的那一份,才算是你的產品。沒上線的、還在會議室裡討論的、還在你心裡盤算的,都不算。」這句話對於那些一天到晚把作品壓在抽屜裡不肯放出去的完美主義者特別重要。對抗平庸跟避免完美主義是同一份紀律的兩面。
MVQP:把 MVP 改成最小可用「品質」產品
為了在「對抗平庸」跟「避免完美主義」之間找到操作上的平衡點,她丟出一個自己造的詞:MVQP,minimum viable QUALITY product,最小可用「品質」產品。這個詞是對矽谷講了二十年的 MVP(minimum viable product,最小可行產品)的修正。
MVP 這個觀念在精實創業(Lean Startup)那一波被推廣到極致,核心是「先把一個能跑的東西丟出去,再根據使用者反應迭代」。這個邏輯在純功能性產品上很管用,但用在那些需要使用者信任的產品上會出問題。一個會直接接觸使用者錢包、信用卡、稅務申報的工具,如果第一版就是「能跑就好」的水準,使用者一旦被嚇到,後面再花十倍力氣也不一定贏得回信任。
她的修正是把「QUALITY」加進去,變成 MVQP。它的意思不是要把品質拉到完美,是要把品質定在一個「不會讓使用者對你失去信任」的最低門檻。低於這個門檻就不該上線,因為一旦失去信任就回不去了。但只要過了這個門檻,就要敢於放出去學習真實使用情境。
她特別強調這個觀念對 AI 產品尤其重要。AI 產品有一個特殊的性質:你沒辦法在內部測試裡完全預測使用者會怎麼使用它。同一個 prompt 介面,研發團隊跑出來的結果跟一萬個真實使用者跑出來的結果完全是兩個世界。你必須讓真實使用者用上這個產品才會知道它的真實表現。但這個「必須上線才能學到」的特性反而讓品質門檻變得更重要,因為一個有 bug 但是基本品質達標的 AI 產品還可以靠迭代修,一個基本品質就不及格的 AI 產品會直接在公開市場被處決。
MVQP 這個詞在概念上提供了一個新的座標:MVP 那個 viable 是技術上能跑的最低標,MVQP 的 viable QUALITY 是能維持使用者信任的最低標。這兩個標的位置差別不只是高低,是定位的差別。
走過店面:每週五全公司在創辦人面前測產品
訪談的最後一段,講了一個 Stripe 內部的紀律性實踐,這個實踐可能是整集訪談最值得抄下來的具體做法。她叫它「walking the store」(走過店面),意思是讓組織裡每一個人定期花時間,把公司的產品像一個真正的使用者那樣從頭用到尾。
這個實踐表面上很簡單,做起來會發現它是一個跟現代軟體公司的工作方式對著幹的舉動。多數工程師、產品經理、數據科學家平常只會碰到自己負責的那一塊產品。負責訂閱模組的工程師對稅務模組的使用體驗一無所知;負責支付流程的 PM 不會去看穩定幣產品最新的設定流程長什麼樣。每個人都在自己的局部最佳化,但拼起來的整體使用體驗是斷裂的。
她用了一個很具象的比喻來描述這個斷裂:「就像你家裡只把飯廳重新裝潢了,其他房間都沒動。突然之間電燈開關不對盤、顏色不搭、其他每一個房間原本看起來還行,現在都顯得很糟。」這個比喻的精準在於,問題不是個別房間的品質下降,而是整體不一致造成的失調。對於跨產品的 Stripe 來說,這個失調幾乎是組織會自動產生的副作用,必須有意識地對抗。
對抗的方法就是「走過店面」這個習慣。Stripe 內部有一個叫 essential journeys(核心旅程)的清單,把跨產品最關鍵的使用者流程列出來,然後用紅黃綠燈的方式打分數,每週更新。這個清單同時是一個責任歸屬的表格:哪一條流程亮紅燈,哪幾個團隊就要一起坐下來對齊。
但 Stripe 真正讓這個實踐有威力的,是另一層儀式:每個禮拜五,創辦人會在全公司面前親自走過店面。這個動作不是表演,是發送訊號。當創辦人把這件事當成最重要的週會主題之一,公司裡每一個人都會明白「使用者體驗的整體性」這件事在這家公司被擺在什麼位置。當這個訊號被持續發送,每個工程師、PM、設計師在做日常決定時,腦子裡會多一個「我這個改動會不會搞砸下週五的 walk」的迴路。
多角色組隊走過店面,看到的東西不一樣
她還補上一個關於「走過店面」的細節:不能只讓設計師走,要讓不同角色的人組隊一起走。一個工程師走、一個 PM 走、一個數據科學家走,三個人會在同一條使用者流程裡注意到完全不同的東西。
工程師看到的多半是技術上的不一致:這個元件是用某個框架寫的,那個是另一個框架的殘留;這個 API 回應時間是 200ms,那個是 1.2 秒;這個錯誤訊息是英文,那個是繁體中文。PM 看到的是業務邏輯的縫隙:這個流程從訂閱跳到稅務時,使用者要重新填一次公司資訊;這個 dashboard 上的指標跟另一個 dashboard 上的指標定義對不起來。數據科學家看到的是埋點和指標的問題:這個按鈕沒埋 event;這個漏斗從 A 到 B 的轉換率是 3% 但沒有人在追為什麼這麼低。
把這三個角色的觀察集合起來,才會接近一個真正使用者會經歷的「複合體驗」(composite experience)。任何單一角色走過店面看到的,都只是這個複合體驗的一個面向。這個跨角色的設計呼應了 Stripe 一個更深的組織信念:產品品質從來不是設計部門一個團隊的責任,是每一個會碰到產品決策的人共同的責任。
我的觀察:臺灣的 AI 工作者該怎麼用這份紀律
這集訪談的核心觀念整套搬到臺灣產品團隊的場景,會有一個很直接的對照。臺灣多數中小型科技公司過去十年最常聽到的設計困境是「資源不夠所以做不細」,AI 工具理論上把這個困境的物質基礎拆掉了一半。今天一個三人團隊用對 AI 工具,可以做出五年前需要十人團隊才做得到的設計密度。
但蒂爾講的所有道理也同時套用過來。如果三人團隊用 AI 把產出量拉到十人團隊的水準,可是品質維持在 7 分,這個團隊長期累積出來的品牌資產跟原本的十人團隊比,差距會是好幾個數量級。AI 沒有改變「品質才是真正的長期競爭力」這件事,它只是改變了達成 7 分的成本,把達成 9 分的成本變成相對更明顯的差異化機會。
我自己這幾年觀察臺灣的設計、產品、內容工作者,最常看到的陷阱是兩種。第一種是被 AI 工具的速度誘惑住,產出量拉很快但每個東西都停在 7 分,半年之後回頭看作品集會發現自己沒有任何一個能拿出來放在最上面的代表作。第二種是反過來,因為對 AI 工具有疑慮刻意不用,結果在效率上被同行甩開好幾個身位,連坐上 7 分這個起跑點的時間都比別人慢。
蒂爾的整套思維提供了第三條路:用 AI 把達成 7 分的成本壓到極低,然後把省下來的時間、精力、注意力,全部投在那 7 到 10 之間的修煉上。這個修煉就是她講的「對抗向平庸的引力」、就是「不要讓這個過去」、就是「每一個像素都需要同樣的關注」。MVQP 是這個修煉的下限,每週走過店面是這個修煉的紀律保證。
對臺灣的工作者來說,這集訪談最值得貼在牆上的不是哪一個框架,而是那個追問:當 AI 把交出 7 分變得這麼容易,你還願意為了那 8 分、9 分、10 分多花一個下午、多開一條 Slack 串、多請主管退一次稿嗎?願意的人會變成這個世代少數還在累積複利品味的那群人。不願意的人,會變成一個跟 AI 一起退化到 7 分平均值的工作者。Stripe 整集訪談都在講這件事。