深度剖析 AI 產品的全新經濟學,以及真正能在實際使用中存活下來的定價框架
企業軟體領域最昂貴的錯誤假設,就是把 AI 產品當成「功能更強的 SaaS」。事實並非如此。AI 產品是一個截然不同的經濟物種,而那些未能認清這點的企業,正朝著一座他們尚未察覺的懸崖一路狂奔。
這個認知變革來自在 2025 年底 OpenAI 產品負責人 Miqdad Jaffer 與產品策略師 Paweł Huryn 聯手發表了一篇文章,這篇文章給予了我跟產品團對於 AI 產品定價產生了很大的啟發。他們的核心論點看似簡單,卻具備顛覆性:各位過去學到的 SaaS 定價知識,可能對 AI 產品不僅毫無幫助,甚至反而有害。
以下是對他們框架的深度延伸探討,並輔以市場數據、實務經驗,以及對所有正在開發、投資或採購 AI 產品者的策略啟示。
根本性斷裂:為何 AI 徹底打破 SaaS 規則
過去二十年,SaaS 經濟學建立在一個優雅的原則上:邊際成本趨近於零。在 Salesforce 上新增一位使用者,增量成本微乎其微。這個假設支撐了從免費增值模式、無限方案,到主導企業軟體市場的按人頭計費架構。
AI 徹底摧毀了這個假設。
每一次與 AI 系統的實質互動,都會產生真實且可變的成本。不只是你在 OpenAI 帳單上看到的 token 費用,而是一連串層層疊加的支出:運算資源配置 、Context Graphs building、檢索操作(Routing、Query Rewriting、Query Extending、Web Searching、Judge-by-LLM…etc)、上下文建構(Context Engineering)、推論執行、流程編排開銷、重試機制,以及評估管線。這些成本不會隨規模縮減,在許多情況下甚至會放大。
來看看實際數字,傳統 SaaS 公司若能達到 80% 至 90% 的毛利率,便有本錢積極進行客戶開發,因為每位新增客戶只會帶來微不足道的營運成本。然而根據 Bessemer Venture Partners 和 Andreessen Horowitz 的研究,AI 原生公司即使在最佳條件下,毛利率也僅有 50% 至 60%。這 20 至 40 個百分點的差距絕非四捨五入的誤差,而是「可持續的單位經濟效益」與「規模越大虧損越慘」之間的天壤之別。
這些影響會層層傳導至每個業務環節,行銷部門無法承受相同的客戶取得成本門檻;適用於傳統軟體的業務獎金結構變得難以為繼;圍繞使用者席次設計的定價模型,在 AI 正在取代那些席次原本該做的工作時,反而創造出負面誘因。
行為難題:你的成本不隨使用者數量成長
這正是 AI 經濟學開始違反直覺的地方,在 SaaS 模式下,成本隨使用者數量成長:席次越多、基礎設施越多,但增幅是線性且可預測的。AI 的成本則隨行為成長,而即使是訂閱相同方案的使用者,行為差異也可能天差地遠。
想像一下兩位企業級方案的客戶,第一位使用你的 AI 助理進行簡短、針對性的查詢:輸入幾句話,得到結構化的輸出。第二位則發現你的系統能處理複雜的研究流程,於是每天進行長達一小時的反覆對話,不斷調整提示詞、觸發多次模型呼叫,一再逼近上下文長度上限。
從定價角度看,這兩位客戶沒有很大的差別。但從損益角度看,他們是兩個極端:一位為你創造健康的利潤,另一位則可能讓你每次互動都在虧錢。
這種行為差異,正是 Jaffer 和 Huryn 所說的 AI 產品經濟學「真正的敵人」。多數團隊執著於「每次請求的平均成本」,但這恰恰是錯誤的指標。AI 系統不會因為平均值而崩盤,而是因為實際使用模式的變異。針對典型行為最佳化的定價模型,會讓你在面對最壞情況時毫無防備。
數據完全可以印證這個隱憂,推論工作負載的分析顯示,一筆定價 0.01 美元的單一 API 呼叫,若計入流程編排、重試,以及完成複雜任務所需的完整操作堆疊,實際成本可能膨脹到 0.40 至 0.70 美元。這是一個潛藏在眼前的 40 至 70 倍乘數,就像我經常很驚嘆到底 OpenAI跟 Anthropic與 Gemini這御三家是有多麽的不計成本用每月 ~20 USD的成本在讓使用者們去肆意的使用 Deep Research與各種多層次資料管線。
AI 成本的七個層次:全新的理解框架
要為 AI 正確定價,首先必須理解你究竟在為什麼付費。適用於傳統軟體的「單一項目」思維在此完全失靈。Jaffer 和 Huryn 提出了一個七層模型,完整呈現正式環境 AI 系統的真實成本結構。
- 第一層:資料準備與維護:在任何推論發生之前,AI 產品就需要對資料管線進行大量投資。訓練資料的收集、清理、標註,以及持續維護,構成了基礎成本。這些成本隨範疇擴大而非使用量增加而成長。這一層在產品討論中往往隱而不見,卻代表著龐大的持續營運負擔。
- 第二層:檢索與記憶體存取:對於任何採用檢索增強生成(RAG)的 AI 系統(這代表越來越多的正式環境系統)或是更複雜 Context Graph或是多層次的 Context Engineering,檢索操作會增加每次查詢的成本。向量資料庫查詢、重新排序運算、記憶體存取模式都是成本來源。關鍵在於,低效的檢索不只直接燒錢,還會因為需要更大的上下文視窗和更複雜的處理,而推高下游費用。
- 第三層:上下文建構:你發送給模型的每個提示都帶著上下文:系統指令、對話紀錄、檢索到的文件、格式規範。這些上下文都有「重量」(以 token 計量),而重量就代表成本。上下文建構的陰險之處,在於它會隨時間默默膨脹。團隊會新增指令來處理邊緣案例、擴充系統提示以維持一致性、納入更多檢索文件以求完整。每次新增看似微小,累積起來卻是無聲複利般的成本成長。
- 第四層:模型執行:這是多數團隊實際追蹤的成本:讓語言模型處理提示的推論費用。但即使在這裡,現實也比「每 token 單價」複雜得多。正式環境系統越來越常採用動態路由,根據任務複雜度選擇不同等級的模型。簡單查詢可能以極低成本命中輕量模型,複雜的推理任務則會導向你最強大(也最昂貴)的選項。你的實際模型執行成本,很大程度取決於使用者群體中任務複雜度的分布。
- 第五層:編排與重試:單一使用者請求往往會觸發多次模型呼叫。代理式系統會將複雜任務拆解為子任務;驗證步驟會檢查輸出品質;錯誤處理會觸發重試邏輯;思維鏈需要連續的推論呼叫。從使用者角度看似一次互動,底層可能代表五次、十次甚至更多的模型調用。每次重試、每個驗證步驟、每個編排決策,都在堆高你的成本基礎。
- 第六層:並行處理:尖峰負載模式決定了基礎設施的配置需求。一個能處理 100 個並行請求的系統,與只能處理 10 個的系統需要截然不同的基礎設施,即使每日總量相同。AI 工作負載的不可預測性使這個問題格外棘手:批次處理作業可能觸發大量並行需求,熱門功能會引來同時使用。為這些尖峰做好準備,意味著為平時閒置的產能付費。
- 第七層:評估、監控與防護機制:正式環境的 AI 系統需要完善的品質保證基礎設施:根據品質標準測試輸出的評估管線、追蹤效能衰退的監控系統、過濾不當內容的防護機制、防止有害輸出的安全機制。這些系統不是隨使用量而是隨應用程式的關鍵程度成長。消費級聊天機器人可能接受較低的評估覆蓋率,但提供治療建議的醫療 AI 則不然。
關鍵雷點在於這些層次並非單純相加,而是相互複合。低效的檢索會膨脹上下文大小;更大的上下文會增加推論成本;更高的推論成本會促使系統導向更小、更便宜的模型;更小的模型有更高的錯誤率;更多錯誤會觸發更多重試;重試會增加並行壓力;並行壓力會迫使過度配置;過度配置會墊高基準成本結構。
這種複合效應意味著,第二層的問題不只會增加第二層的成本,還會層層傳導至第三、四、五、六層。
定價即系統控制:典範的轉移
以下這個觀點是多數產品團隊完全忽略的,但它將徹底改變你對 AI 產品策略的思考方式。
在傳統 SaaS 中,定價主要控制的是存取權:誰能使用產品?每個級別有哪些功能?無論定價如何,產品體驗大致維持不變。
在 AI 產品中,定價控制的是行為。你的定價模型決定了使用者多頻繁觸發推論、多積極實驗提示詞、是批次發送請求還是逐筆發送、願意忍受延遲還是要求即時回應、多積極重試失敗的請求,以及是否會探索邊緣案例或只走熟悉的路。
這意味著定價不只是上市策略的決定,更是系統設計的決定。你選擇的定價模型,會形塑你的基礎設施必須承受的行為壓力。一旦搞錯,你就創造了一個「越成功越賠錢」的系統。
這意味著開發 AI 功能的產品經理,再也不能在開發結束時把定價丟給商務團隊。定價模型必須與技術架構同步設計,並深刻理解不同的定價訊號將如何形塑該架構必須支撐的使用模式。
存活下來的四種定價模型
在釐清傳統方法為何失效之後,實務問題變成:什麼才管用?市場分析與實務經驗顯示,有四種模型能在 AI 產品獨特的經濟環境中存活。
用量計費
這是將 AI 可變成本結構最直接轉化為定價的方式。客戶按 token、按查詢、按推論呼叫,或按某個與你實際成本相關的消費指標付費。
這種模型最適合已具備成本控制意識的客戶。開發者工具、API 產品和基礎設施類產品,吸引的是預期消費計費並已建立管理機制的使用者。定價與成本之間的對應是透明的,這能與老練的買家建立信任。
挑戰在於「計量焦慮」。當每次互動都有可見成本時,使用者會變得保守,猶豫是否要探索、實驗或發揮系統的能力。對於靠參與度和探索來創造價值的產品而言,這種行為抑制可能是致命傷。
來自定價分析公司 Pilot 的數據顯示,純粹的用量計費模型在 AI 產品中正在萎縮,從 2024 年初約 21% 的公司降至 2025 年底約 15%。這種模型雖然存活下來,但越來越常與其他方式混合使用。
混合計費
這是當今 AI 市場的主流做法,結合基本訂閱費與用量計費元件。客戶支付一筆平台費,提供可預測的營收並涵蓋基準成本;當消費超過包含的額度時,則額外付費。
這種模型能有效平衡各方需求,訂閱元件為財務規劃提供營收可預測性;用量元件維持成本對應並防止無上限的曝險;包含的額度讓使用者能自由探索而不必承受計量焦慮;超額計費則讓最壞情況下的行為在經濟上仍可持續。
多項研究顯示,混合模型目前佔 AI 產品定價的 40% 以上,較 2024 年初的約 27% 成長。像 Intercom 這樣的公司,其 Fin AI 客服機器人就成功採用混合架構,結合席次授權與每次解決問題的收費。
混合模型的風險在於如何正確校準包含的額度。設得太高,你就是在訓練使用者養成昂貴的消費習慣,而這會變成他們認為理所當然的權益;設得太低,又會重蹈純用量計費的計量焦慮覆轍。
成果計費
這是與 AI 價值主張在理念上最契合的模型:客戶在 AI 成功完成定義的任務時才付費。對客服 AI 而言,可能是按解決的工單計費;對銷售 AI,按合格潛在客戶計費;對程式碼助手,按被採納的程式碼建議計費。
這種模型深深打動買家,因為它把風險轉移給了供應商。客戶只在獲得價值時才付費,消除了為表現不佳的 AI 付費的疑慮。對供應商而言,成功的成果計費展現了對自家產品的信心,也能因此收取可觀的溢價。
然而挑戰不小。你需要成熟的系統,能夠穩定交付可衡量的成果;你需要完善的評估基礎設施來精準追蹤成功率;你還需要清晰、無可爭議的定義來界定何謂「成功」。
由 Bret Taylor 創辦的客服 AI 公司 Sierra 已成功實施成果計費,按成功解決的客戶詢問收費。他們的模型之所以可行,是因為客服有天然清晰的成功標準:客戶的問題要麼解決了,要麼沒有。
對於價值主張較模糊的產品,成果計費就變得危險。什麼算是「成功的」創意寫作會話?什麼是「有價值的」研究摘要?這種模糊性會引發爭議,並破壞模型的核心承諾。
容量計費
與其對消費收費,容量計費模型是對預留資源收費。客戶為保證的吞吐量、並行上限或服務等級承諾付費。
這種方式適合延遲比數量更重要、並行處理比總使用量更影響基礎設施成本、以及可靠性為核心價值主張的產品。具有嚴格 SLA 要求的企業 AI 應用,往往覺得容量計費比追蹤個別交易更自然。
營運要求相當高。你必須確實交付預留的容量,這需要精密的基礎設施管理。而且你的業務團隊需要協助客戶精準預估他們的容量需求,而在 AI 工作負載本質上難以預測的情況下,這會是一場艱難的對話。
什麼會摧毀定價策略:來自實戰的教訓
理解什麼有效,不如理解什麼會失敗來得重要。有幾種模式會持續摧毀 AI 產品的經濟效益。
- 慷慨陷阱:產品團隊為了推動採用,設計出慷慨的免費方案、無限試用期,或大幅折扣的企業合約。在 SaaS 中,這種慷慨或許還能維持,因為增量使用幾乎零成本。但在 AI 中,你是在補貼每一次互動,並訓練使用者養成你無力維持的消費習慣。當你終於調整定價以反映真實經濟狀況時,使用者會感到被背叛。他們已經圍繞「免費」的 AI 功能建立了工作流程,而這些功能突然要收費了。這種重新定價造成的關係傷害,往往超過當初慷慨所創造的好感。
- 公平謬誤:團隊追求讓客戶感覺「公平」的定價,卻未考慮這對企業是否可行。吃到飽的統一費率感覺公平,因為人人付一樣的錢。但對 AI 產品來說,這無異於經濟自殺:你最重度的使用者所造成的成本,是由輕度使用者在補貼,而重度使用者有高度動機將使用量最大化。Jaffer 和 Huryn 語出驚人地指出,「公平」定價其實是個陷阱。看起來不公平但與真實成本結構對應的定價,反而比看起來公平但在無可避免的調整到來時引發怨懟的定價,更能建立可持續的客戶關係。
- 平均值謬誤:以平均使用模式為基礎建立定價,會讓你暴露在分布的極端值之下。那些消費量高於平均值五到十個標準差的客戶,可能只佔你使用者群的極小比例,卻可能主導你的成本結構。
穩健的 AI 定價模型會明確考量最壞情況的行為。如果客戶持續不斷地使用你的系統會怎樣?如果他們找到方法觸發昂貴的處理模式呢?如果他們的使用量在簽約後大幅成長呢?你的定價必須在所有可能行為的範圍內都可行,而非只針對預期的平均值。
產品經理的新使命
這些經濟現實,重新定義了成為 AI 產品經理意味著什麼。
在傳統軟體中,產品經理(幾乎?)可以把基礎設施視為隱形的存在。你設計功能、定義需求,工程團隊自會想辦法建置和運行。成本可見性是財務部門的事,不是產品部門的事。
但 AI 產品(愈來愈明顯)不允許這種分工,每個功能決策同時也是經濟決策。你選擇的模型、Data Pipeline、建構的上下文、實作的重試邏輯、要求的評估管線,全都直接影響你的成本結構,進而影響你的定價可行性。
開發 AI 產品的產品經理,需要對系統的成本架構有深度掌握。不只是「token 要花錢」的粗略概念,而是真正理解七個層次如何互動、變異從哪裡進入系統、以及設計決策如何傳導至單位經濟效益。
這代表產品管理角色的重大擴展,也代表培養這種能力的團隊將獲得競爭優勢。如果你的產品經理深刻理解 AI 經濟學,他們就能設計出既有吸引力又可持續的功能。缺乏這種理解的競爭對手,不是低價到難以為繼,就是高價到無人問津。
市場動態:這一切將通往何處
AI 產品面臨的定價挑戰並非靜態。有幾股力量正在持續重塑這個版圖。
- 推論成本通縮:運行 AI 模型的成本持續大幅下降。DeepSeek 的 R1 模型展示了比主要供應商同級產品低 20 至 50 倍的成本結構。這種通縮正在改變每一個定價決策的計算。對 AI 產品公司而言,推論成本通縮是把雙面刃。如果你維持原價,較低的成本能改善利潤。但它也降低了競爭門檻,並讓客戶預期降價。勝出的將是那些透過差異化來捕捉效率紅利、同時維持定價能力的公司。
- 席次計費的出走潮:按席次計費(數十年來企業軟體的主流模式)對 AI 產品來說越來越難以為繼。當 AI 能完成過去需要人類員工做的工作時,按席次收費會製造一種詭異的負面經濟誘因:客戶用你的 AI 產品獲得成功,需要的席次變少,而你的營收跟著下降。數據證實了這個結構性轉變。席次計費在過去十二個月從約 21% 的 AI 產品定價降至約 15%。隨著 AI 能力持續擴展到傳統知識工作領域,這個趨勢看來將持續下去。
- 整合壓力:AI 定價的複雜性為簡化買家決策的平台創造了機會。預期 AI 功能將越來越多地被整合進大型平台產品中,以更廣泛價值的組成元件來定價,而非獨立產品。這種整合壓力將擠壓單點解決方案供應商。採用複雜用量計費的獨立 AI 工具,在結構上會處於劣勢,難以對抗那些在熟悉的訂閱模式中提供 AI 功能的整合平台。
實務落地:策略檢核清單
對於正在應對這些動態的團隊,有幾個實務優先事項浮現。
首先在七個層次全面建立真正的成本可見性。如果你不了解成本,就無法有效定價。部署追蹤機制,不只追蹤推論費用,還要追蹤檢索操作、上下文建構、重試率、並行模式和評估開銷。讓這些數據對產品和商務團隊都可取得,而非只有工程團隊。
其次是分析現有使用者群中的行為變異。不只要找出你的平均使用者,還要找出你的高成本使用者。什麼行為推高了他們的成本?他們最重度使用什麼功能?他們使用模式中的哪些特徵可以透過定價誘因來引導?
第三要務是檢視你目前的定價與成本結構之間的對應關係。你的收費方式是否與實際支出相關?是否有使用者行為產生成本卻沒產生營收?是否有你無意間抑制的獲利行為?
再來為最壞情況的行為設計,而非平均行為。對想把消費最大化的使用者壓力測試你的定價模型。你的單位經濟效益能撐得住嗎?如果不能,什麼機制可以限制曝險又不至於摧毀產品價值?
最後(其實還有很多)在定價與架構之間建立回饋迴路。建立流程,讓定價決策影響技術藍圖,讓技術決策影響定價策略。商務團隊與工程團隊之間的隔閡,在 AI 產品中是行不通的。
定價就是策略
這篇分析所想要傳達的核心論述是:在 AI 產品中,定價已從商務職能升級為策略學科。
在傳統軟體中,你可以先開發產品、確立定價,然後相對獨立地各自迭代。產品開發、上市策略和定價最佳化是不同的工作流程,只偶爾交會。
AI 產品不允許這種切割。你的定價模型形塑使用者行為;使用者行為決定系統負載;系統負載驅動基礎設施成本;基礎設施成本限制定價選項。整個循環緊密耦合,任何一點的決策都會傳導至全局。
認清這種耦合關係,並在產品、定價和基礎設施之間建立整合策略的公司,將發展出可持續的競爭地位。那些把定價當成事後考量(等產品做好再讓商務團隊去想辦法)的公司,往往要到達到一定規模後,才會發現單位經濟效益根本行不通。
令人不安的事實是:目前市場上許多 AI 產品都定價過低(ChatGPT、Claude跟 Gemini等等產品是我認為人類歷史上大大被低估價值的產品)。它們表面上的成功,掩蓋了在規模化後將難以為繼的經濟結構。沒有定價紀律的成長,只是把失敗延後罷了。
將定義 AI 時代的公司,是那些以清醒的眼光理解自身真實經濟狀況、採用與成本現實相符的定價模型、並打造既能創造價值又能永續經營的產品策略的公司。這是 AI 產品卓越的新標準,而市場才剛開始執行它。
本分析借鑑了 OpenAI 的 Miqdad Jaffer 與 Paweł Huryn 所開發的框架,並輔以 Bessemer Venture Partners、Andreessen Horowitz、Emergence Capital 的市場研究,以及來自 Growth Unhinged 和 Pilot 的定價數據。對於正在開發 AI 產品的團隊,Product Compass 的原始資料值得深入研究。


