SaaS 定價之死：為何你的 AI 產品經濟模型從根本上就是錯的

深度剖析 AI 產品的全新經濟學，以及真正能在實際使用中存活下來的定價框架

企業軟體領域最昂貴的錯誤假設，就是把 AI 產品當成「功能更強的 SaaS」。事實並非如此。AI 產品是一個截然不同的經濟物種，而那些未能認清這點的企業，正朝著一座他們尚未察覺的懸崖一路狂奔。

這個認知變革來自在 2025 年底 OpenAI 產品負責人 Miqdad Jaffer 與產品策略師 Paweł Huryn 聯手發表了一篇文章，這篇文章給予了我跟產品團對於 AI 產品定價產生了很大的啟發。他們的核心論點看似簡單，卻具備顛覆性：各位過去學到的 SaaS 定價知識，可能對 AI 產品不僅毫無幫助，甚至反而有害。

以下是對他們框架的深度延伸探討，並輔以市場數據、實務經驗，以及對所有正在開發、投資或採購 AI 產品者的策略啟示。

Table of Contents

根本性斷裂：為何 AI 徹底打破 SaaS 規則

過去二十年，SaaS 經濟學建立在一個優雅的原則上：邊際成本趨近於零。在 Salesforce 上新增一位使用者，增量成本微乎其微。這個假設支撐了從免費增值模式、無限方案，到主導企業軟體市場的按人頭計費架構。

AI 徹底摧毀了這個假設。

每一次與 AI 系統的實質互動，都會產生真實且可變的成本。不只是你在 OpenAI 帳單上看到的 token 費用，而是一連串層層疊加的支出：運算資源配置、Context Graphs building、檢索操作（Routing、Query Rewriting、Query Extending、Web Searching、Judge-by-LLM…etc）、上下文建構（Context Engineering）、推論執行、流程編排開銷、重試機制，以及評估管線。這些成本不會隨規模縮減，在許多情況下甚至會放大。

來看看實際數字，傳統 SaaS 公司若能達到 80% 至 90% 的毛利率，便有本錢積極進行客戶開發，因為每位新增客戶只會帶來微不足道的營運成本。然而根據 Bessemer Venture Partners 和 Andreessen Horowitz 的研究，AI 原生公司即使在最佳條件下，毛利率也僅有 50% 至 60%。這 20 至 40 個百分點的差距絕非四捨五入的誤差，而是「可持續的單位經濟效益」與「規模越大虧損越慘」之間的天壤之別。

這些影響會層層傳導至每個業務環節，行銷部門無法承受相同的客戶取得成本門檻；適用於傳統軟體的業務獎金結構變得難以為繼；圍繞使用者席次設計的定價模型，在 AI 正在取代那些席次原本該做的工作時，反而創造出負面誘因。

行為難題：你的成本不隨使用者數量成長

這正是 AI 經濟學開始違反直覺的地方，在 SaaS 模式下，成本隨使用者數量成長：席次越多、基礎設施越多，但增幅是線性且可預測的。AI 的成本則隨行為成長，而即使是訂閱相同方案的使用者，行為差異也可能天差地遠。

想像一下兩位企業級方案的客戶，第一位使用你的 AI 助理進行簡短、針對性的查詢：輸入幾句話，得到結構化的輸出。第二位則發現你的系統能處理複雜的研究流程，於是每天進行長達一小時的反覆對話，不斷調整提示詞、觸發多次模型呼叫，一再逼近上下文長度上限。

從定價角度看，這兩位客戶沒有很大的差別。但從損益角度看，他們是兩個極端：一位為你創造健康的利潤，另一位則可能讓你每次互動都在虧錢。

這種行為差異，正是 Jaffer 和 Huryn 所說的 AI 產品經濟學「真正的敵人」。多數團隊執著於「每次請求的平均成本」，但這恰恰是錯誤的指標。AI 系統不會因為平均值而崩盤，而是因為實際使用模式的變異。針對典型行為最佳化的定價模型，會讓你在面對最壞情況時毫無防備。

數據完全可以印證這個隱憂，推論工作負載的分析顯示，一筆定價 0.01 美元的單一 API 呼叫，若計入流程編排、重試，以及完成複雜任務所需的完整操作堆疊，實際成本可能膨脹到 0.40 至 0.70 美元。這是一個潛藏在眼前的 40 至 70 倍乘數，就像我經常很驚嘆到底 OpenAI跟 Anthropic與 Gemini這御三家是有多麽的不計成本用每月 ~20 USD的成本在讓使用者們去肆意的使用 Deep Research與各種多層次資料管線。

AI 成本的七個層次：全新的理解框架

要為 AI 正確定價，首先必須理解你究竟在為什麼付費。適用於傳統軟體的「單一項目」思維在此完全失靈。Jaffer 和 Huryn 提出了一個七層模型，完整呈現正式環境 AI 系統的真實成本結構。

第一層：資料準備與維護：在任何推論發生之前，AI 產品就需要對資料管線進行大量投資。訓練資料的收集、清理、標註，以及持續維護，構成了基礎成本。這些成本隨範疇擴大而非使用量增加而成長。這一層在產品討論中往往隱而不見，卻代表著龐大的持續營運負擔。
第二層：檢索與記憶體存取：對於任何採用檢索增強生成（RAG）的 AI 系統（這代表越來越多的正式環境系統）或是更複雜 Context Graph或是多層次的 Context Engineering，檢索操作會增加每次查詢的成本。向量資料庫查詢、重新排序運算、記憶體存取模式都是成本來源。關鍵在於，低效的檢索不只直接燒錢，還會因為需要更大的上下文視窗和更複雜的處理，而推高下游費用。
第三層：上下文建構：你發送給模型的每個提示都帶著上下文：系統指令、對話紀錄、檢索到的文件、格式規範。這些上下文都有「重量」（以 token 計量），而重量就代表成本。上下文建構的陰險之處，在於它會隨時間默默膨脹。團隊會新增指令來處理邊緣案例、擴充系統提示以維持一致性、納入更多檢索文件以求完整。每次新增看似微小，累積起來卻是無聲複利般的成本成長。
第四層：模型執行：這是多數團隊實際追蹤的成本：讓語言模型處理提示的推論費用。但即使在這裡，現實也比「每 token 單價」複雜得多。正式環境系統越來越常採用動態路由，根據任務複雜度選擇不同等級的模型。簡單查詢可能以極低成本命中輕量模型，複雜的推理任務則會導向你最強大（也最昂貴）的選項。你的實際模型執行成本，很大程度取決於使用者群體中任務複雜度的分布。
第五層：編排與重試：單一使用者請求往往會觸發多次模型呼叫。代理式系統會將複雜任務拆解為子任務；驗證步驟會檢查輸出品質；錯誤處理會觸發重試邏輯；思維鏈需要連續的推論呼叫。從使用者角度看似一次互動，底層可能代表五次、十次甚至更多的模型調用。每次重試、每個驗證步驟、每個編排決策，都在堆高你的成本基礎。
第六層：並行處理：尖峰負載模式決定了基礎設施的配置需求。一個能處理 100 個並行請求的系統，與只能處理 10 個的系統需要截然不同的基礎設施，即使每日總量相同。AI 工作負載的不可預測性使這個問題格外棘手：批次處理作業可能觸發大量並行需求，熱門功能會引來同時使用。為這些尖峰做好準備，意味著為平時閒置的產能付費。
第七層：評估、監控與防護機制：正式環境的 AI 系統需要完善的品質保證基礎設施：根據品質標準測試輸出的評估管線、追蹤效能衰退的監控系統、過濾不當內容的防護機制、防止有害輸出的安全機制。這些系統不是隨使用量而是隨應用程式的關鍵程度成長。消費級聊天機器人可能接受較低的評估覆蓋率，但提供治療建議的醫療 AI 則不然。

關鍵雷點在於這些層次並非單純相加，而是相互複合。低效的檢索會膨脹上下文大小；更大的上下文會增加推論成本；更高的推論成本會促使系統導向更小、更便宜的模型；更小的模型有更高的錯誤率；更多錯誤會觸發更多重試；重試會增加並行壓力；並行壓力會迫使過度配置；過度配置會墊高基準成本結構。

這種複合效應意味著，第二層的問題不只會增加第二層的成本，還會層層傳導至第三、四、五、六層。

定價即系統控制：典範的轉移

以下這個觀點是多數產品團隊完全忽略的，但它將徹底改變你對 AI 產品策略的思考方式。

在傳統 SaaS 中，定價主要控制的是存取權：誰能使用產品？每個級別有哪些功能？無論定價如何，產品體驗大致維持不變。

在 AI 產品中，定價控制的是行為。你的定價模型決定了使用者多頻繁觸發推論、多積極實驗提示詞、是批次發送請求還是逐筆發送、願意忍受延遲還是要求即時回應、多積極重試失敗的請求，以及是否會探索邊緣案例或只走熟悉的路。

這意味著定價不只是上市策略的決定，更是系統設計的決定。你選擇的定價模型，會形塑你的基礎設施必須承受的行為壓力。一旦搞錯，你就創造了一個「越成功越賠錢」的系統。

這意味著開發 AI 功能的產品經理，再也不能在開發結束時把定價丟給商務團隊。定價模型必須與技術架構同步設計，並深刻理解不同的定價訊號將如何形塑該架構必須支撐的使用模式。

存活下來的四種定價模型

在釐清傳統方法為何失效之後，實務問題變成：什麼才管用？市場分析與實務經驗顯示，有四種模型能在 AI 產品獨特的經濟環境中存活。

用量計費

這是將 AI 可變成本結構最直接轉化為定價的方式。客戶按 token、按查詢、按推論呼叫，或按某個與你實際成本相關的消費指標付費。

這種模型最適合已具備成本控制意識的客戶。開發者工具、API 產品和基礎設施類產品，吸引的是預期消費計費並已建立管理機制的使用者。定價與成本之間的對應是透明的，這能與老練的買家建立信任。

挑戰在於「計量焦慮」。當每次互動都有可見成本時，使用者會變得保守，猶豫是否要探索、實驗或發揮系統的能力。對於靠參與度和探索來創造價值的產品而言，這種行為抑制可能是致命傷。

來自定價分析公司 Pilot 的數據顯示，純粹的用量計費模型在 AI 產品中正在萎縮，從 2024 年初約 21% 的公司降至 2025 年底約 15%。這種模型雖然存活下來，但越來越常與其他方式混合使用。

混合計費

這是當今 AI 市場的主流做法，結合基本訂閱費與用量計費元件。客戶支付一筆平台費，提供可預測的營收並涵蓋基準成本；當消費超過包含的額度時，則額外付費。

這種模型能有效平衡各方需求，訂閱元件為財務規劃提供營收可預測性；用量元件維持成本對應並防止無上限的曝險；包含的額度讓使用者能自由探索而不必承受計量焦慮；超額計費則讓最壞情況下的行為在經濟上仍可持續。

多項研究顯示，混合模型目前佔 AI 產品定價的 40% 以上，較 2024 年初的約 27% 成長。像 Intercom 這樣的公司，其 Fin AI 客服機器人就成功採用混合架構，結合席次授權與每次解決問題的收費。

混合模型的風險在於如何正確校準包含的額度。設得太高，你就是在訓練使用者養成昂貴的消費習慣，而這會變成他們認為理所當然的權益；設得太低，又會重蹈純用量計費的計量焦慮覆轍。

成果計費

這是與 AI 價值主張在理念上最契合的模型：客戶在 AI 成功完成定義的任務時才付費。對客服 AI 而言，可能是按解決的工單計費；對銷售 AI，按合格潛在客戶計費；對程式碼助手，按被採納的程式碼建議計費。

這種模型深深打動買家，因為它把風險轉移給了供應商。客戶只在獲得價值時才付費，消除了為表現不佳的 AI 付費的疑慮。對供應商而言，成功的成果計費展現了對自家產品的信心，也能因此收取可觀的溢價。

然而挑戰不小。你需要成熟的系統，能夠穩定交付可衡量的成果；你需要完善的評估基礎設施來精準追蹤成功率；你還需要清晰、無可爭議的定義來界定何謂「成功」。

由 Bret Taylor 創辦的客服 AI 公司 Sierra 已成功實施成果計費，按成功解決的客戶詢問收費。他們的模型之所以可行，是因為客服有天然清晰的成功標準：客戶的問題要麼解決了，要麼沒有。

對於價值主張較模糊的產品，成果計費就變得危險。什麼算是「成功的」創意寫作會話？什麼是「有價值的」研究摘要？這種模糊性會引發爭議，並破壞模型的核心承諾。

容量計費

與其對消費收費，容量計費模型是對預留資源收費。客戶為保證的吞吐量、並行上限或服務等級承諾付費。

這種方式適合延遲比數量更重要、並行處理比總使用量更影響基礎設施成本、以及可靠性為核心價值主張的產品。具有嚴格 SLA 要求的企業 AI 應用，往往覺得容量計費比追蹤個別交易更自然。

營運要求相當高。你必須確實交付預留的容量，這需要精密的基礎設施管理。而且你的業務團隊需要協助客戶精準預估他們的容量需求，而在 AI 工作負載本質上難以預測的情況下，這會是一場艱難的對話。

什麼會摧毀定價策略：來自實戰的教訓

理解什麼有效，不如理解什麼會失敗來得重要。有幾種模式會持續摧毀 AI 產品的經濟效益。

慷慨陷阱：產品團隊為了推動採用，設計出慷慨的免費方案、無限試用期，或大幅折扣的企業合約。在 SaaS 中，這種慷慨或許還能維持，因為增量使用幾乎零成本。但在 AI 中，你是在補貼每一次互動，並訓練使用者養成你無力維持的消費習慣。當你終於調整定價以反映真實經濟狀況時，使用者會感到被背叛。他們已經圍繞「免費」的 AI 功能建立了工作流程，而這些功能突然要收費了。這種重新定價造成的關係傷害，往往超過當初慷慨所創造的好感。
公平謬誤：團隊追求讓客戶感覺「公平」的定價，卻未考慮這對企業是否可行。吃到飽的統一費率感覺公平，因為人人付一樣的錢。但對 AI 產品來說，這無異於經濟自殺：你最重度的使用者所造成的成本，是由輕度使用者在補貼，而重度使用者有高度動機將使用量最大化。Jaffer 和 Huryn 語出驚人地指出，「公平」定價其實是個陷阱。看起來不公平但與真實成本結構對應的定價，反而比看起來公平但在無可避免的調整到來時引發怨懟的定價，更能建立可持續的客戶關係。
平均值謬誤：以平均使用模式為基礎建立定價，會讓你暴露在分布的極端值之下。那些消費量高於平均值五到十個標準差的客戶，可能只佔你使用者群的極小比例，卻可能主導你的成本結構。

穩健的 AI 定價模型會明確考量最壞情況的行為。如果客戶持續不斷地使用你的系統會怎樣？如果他們找到方法觸發昂貴的處理模式呢？如果他們的使用量在簽約後大幅成長呢？你的定價必須在所有可能行為的範圍內都可行，而非只針對預期的平均值。

產品經理的新使命

這些經濟現實，重新定義了成為 AI 產品經理意味著什麼。

在傳統軟體中，產品經理（幾乎？）可以把基礎設施視為隱形的存在。你設計功能、定義需求，工程團隊自會想辦法建置和運行。成本可見性是財務部門的事，不是產品部門的事。

但 AI 產品（愈來愈明顯）不允許這種分工，每個功能決策同時也是經濟決策。你選擇的模型、Data Pipeline、建構的上下文、實作的重試邏輯、要求的評估管線，全都直接影響你的成本結構，進而影響你的定價可行性。

開發 AI 產品的產品經理，需要對系統的成本架構有深度掌握。不只是「token 要花錢」的粗略概念，而是真正理解七個層次如何互動、變異從哪裡進入系統、以及設計決策如何傳導至單位經濟效益。

這代表產品管理角色的重大擴展，也代表培養這種能力的團隊將獲得競爭優勢。如果你的產品經理深刻理解 AI 經濟學，他們就能設計出既有吸引力又可持續的功能。缺乏這種理解的競爭對手，不是低價到難以為繼，就是高價到無人問津。

市場動態：這一切將通往何處

AI 產品面臨的定價挑戰並非靜態。有幾股力量正在持續重塑這個版圖。

推論成本通縮：運行 AI 模型的成本持續大幅下降。DeepSeek 的 R1 模型展示了比主要供應商同級產品低 20 至 50 倍的成本結構。這種通縮正在改變每一個定價決策的計算。對 AI 產品公司而言，推論成本通縮是把雙面刃。如果你維持原價，較低的成本能改善利潤。但它也降低了競爭門檻，並讓客戶預期降價。勝出的將是那些透過差異化來捕捉效率紅利、同時維持定價能力的公司。
席次計費的出走潮：按席次計費（數十年來企業軟體的主流模式）對 AI 產品來說越來越難以為繼。當 AI 能完成過去需要人類員工做的工作時，按席次收費會製造一種詭異的負面經濟誘因：客戶用你的 AI 產品獲得成功，需要的席次變少，而你的營收跟著下降。數據證實了這個結構性轉變。席次計費在過去十二個月從約 21% 的 AI 產品定價降至約 15%。隨著 AI 能力持續擴展到傳統知識工作領域，這個趨勢看來將持續下去。
整合壓力：AI 定價的複雜性為簡化買家決策的平台創造了機會。預期 AI 功能將越來越多地被整合進大型平台產品中，以更廣泛價值的組成元件來定價，而非獨立產品。這種整合壓力將擠壓單點解決方案供應商。採用複雜用量計費的獨立 AI 工具，在結構上會處於劣勢，難以對抗那些在熟悉的訂閱模式中提供 AI 功能的整合平台。

實務落地：策略檢核清單

對於正在應對這些動態的團隊，有幾個實務優先事項浮現。

首先在七個層次全面建立真正的成本可見性。如果你不了解成本，就無法有效定價。部署追蹤機制，不只追蹤推論費用，還要追蹤檢索操作、上下文建構、重試率、並行模式和評估開銷。讓這些數據對產品和商務團隊都可取得，而非只有工程團隊。

其次是分析現有使用者群中的行為變異。不只要找出你的平均使用者，還要找出你的高成本使用者。什麼行為推高了他們的成本？他們最重度使用什麼功能？他們使用模式中的哪些特徵可以透過定價誘因來引導？

第三要務是檢視你目前的定價與成本結構之間的對應關係。你的收費方式是否與實際支出相關？是否有使用者行為產生成本卻沒產生營收？是否有你無意間抑制的獲利行為？

再來為最壞情況的行為設計，而非平均行為。對想把消費最大化的使用者壓力測試你的定價模型。你的單位經濟效益能撐得住嗎？如果不能，什麼機制可以限制曝險又不至於摧毀產品價值？

最後（其實還有很多）在定價與架構之間建立回饋迴路。建立流程，讓定價決策影響技術藍圖，讓技術決策影響定價策略。商務團隊與工程團隊之間的隔閡，在 AI 產品中是行不通的。

定價就是策略

這篇分析所想要傳達的核心論述是：在 AI 產品中，定價已從商務職能升級為策略學科。

在傳統軟體中，你可以先開發產品、確立定價，然後相對獨立地各自迭代。產品開發、上市策略和定價最佳化是不同的工作流程，只偶爾交會。

AI 產品不允許這種切割。你的定價模型形塑使用者行為；使用者行為決定系統負載；系統負載驅動基礎設施成本；基礎設施成本限制定價選項。整個循環緊密耦合，任何一點的決策都會傳導至全局。

認清這種耦合關係，並在產品、定價和基礎設施之間建立整合策略的公司，將發展出可持續的競爭地位。那些把定價當成事後考量（等產品做好再讓商務團隊去想辦法）的公司，往往要到達到一定規模後，才會發現單位經濟效益根本行不通。

令人不安的事實是：目前市場上許多 AI 產品都定價過低（ChatGPT、Claude跟 Gemini等等產品是我認為人類歷史上大大被低估價值的產品）。它們表面上的成功，掩蓋了在規模化後將難以為繼的經濟結構。沒有定價紀律的成長，只是把失敗延後罷了。

將定義 AI 時代的公司，是那些以清醒的眼光理解自身真實經濟狀況、採用與成本現實相符的定價模型、並打造既能創造價值又能永續經營的產品策略的公司。這是 AI 產品卓越的新標準，而市場才剛開始執行它。

本分析借鑑了 OpenAI 的 Miqdad Jaffer 與 Paweł Huryn 所開發的框架，並輔以 Bessemer Venture Partners、Andreessen Horowitz、Emergence Capital 的市場研究，以及來自 Growth Unhinged 和 Pilot 的定價數據。對於正在開發 AI 產品的團隊，Product Compass 的原始資料值得深入研究。