The pricing of generative AI foundation models


基本上,在 AWS 上要能夠成功執行起 Llama 2 Chat (7B) #7B而已呦不是70B呦 的 Hello World 沒開個 g5.4xlarge 是跑不起來的,一個月不關機器採用 on-demand 的話要燒掉 37,968.84 TWD,反之用 AWS 的 Bedrock 你開個 Llama 2 Chat(70B)每 1k tokens 的推論成本只要 0.00195 USD,也是就 0.061 TWD,不得不說 IaaS 的經濟規模化真的是非常強大,做 model routing 不用 IaaS 的解決方案勢必是非常沒有效率的,除非有很特殊的需求必須徹底從模型的原始權重開始訓練起,不然自己部署 foundation model 幾乎是沒有任何好處。


VendorModel nameContextInput tokens cost per 1k tokensOutput tokens cost per 1k tokens
Amazon BedrockJurassic-2 Mid0.01250.0125
Amazon BedrockJurassic-2 Ultra0.01880.0188
Amazon BedrockTitan Text Lite0.00030.0004
Amazon BedrockTitan Text Express0.00080.0016
Amazon BedrockClaude Instant0.001630.00551
AnthropicClaude Instant100k tokens0.000780.00234
Amazon BedrockClaude0.0080.024
AnthropicClaude 2.0100k tokens0.00780.00234
AnthropicClaude 2.1200k tokens0.00780.00234
Amazon BedrockCohere | Command0.00150.002
CohereCommand0.0010.002
Amazon BedrockCohere | Command-Light0.00030.0006
CohereCommand-Light0.00030.0006
Amazon BedrockLlama 2 Chat (13B)0.000750.00100
Amazon BedrockLlama 2 Chat (70B)0.001950.00256
AzureMeta Llama-2-70B0.001540.00177
OpenAIgpt-4-1106-preview0.010.03
OpenAIgpt-4-1106-vision-preview0.010.03
OpenAIgpt-40.030.06
OpenAIgpt-4-32k0.060.12
OpenAIgpt-3.5-turbo-11060.00100.002
OpenAIgpt-3.5-turbo-instruct0.00150.002
AzureGPT-3.5-Turbo4K0.00150.002
AzureGPT-3.5-Turbo16K0.0030.004
AzureGPT-48k0.030.06
AzureGPT-432k0.060.12
GCPPaLM 2 for Chat (Chat Bison)0.0010.002
GCPPaLM 2 for Chat 32k (Chat Bison 32k)0.0010.002
GCPGemini0.0010.002
金額單位:USD

Google 的 PaLM 採用的是以每千個字元為計算單位,所以我粗略的以 1,000 字元約莫 200~250 token 取 upper bound 來計算去統一計價單位,那 1k tokens ~= 4k characters,轉換後 PaLM 2 for Chat(Chat Bison)推論 1k token 的成本是 0.001 USD / 1k tokens,輸出 1k tokens 的成本是 0.002 USD / 1k tokens。

PaLM 2 for Chat(Chat Bison)

Input 1,000 characters = $0.00025

1,000 characters ~= 200 ~ 250 tokens

1,000 tokens ~= 4,000 characters

4,000 characters cost = $0.00025(cost per 1k characters)* 4 = $0.001

OpenAI token 成本估算

成本估算上我們假設一段 589 個繁體中文的語料如下。

這是一段約 589 個中文字的文字。在這段文字中,我們將探討多種主題,包括文化、科技、自然和藝術。文化是一個廣泛的主題,它包含了人們的生活方式、傳統、價值觀和信仰。每個文化都有其獨特之處,從語言到習俗,從飲食到節日慶典。例如,中國的春節和中秋節是重要的傳統節日,人們會聚在一起慶祝,分享食物,並表達對未來的祝福。

科技的進步對我們的生活產生了深遠的影響。從智能手機到人工智能,從可持續能源到太空探索,科技不斷推動著人類前進。隨著時間的推移,我們期待更多創新的技術來解決全球性的挑戰,如氣候變化和健康危機。

自然是另一個重要主題。我們的地球擁有豐富多樣的生態系統,從茂密的雨林到廣闊的沙漠,從深邃的海洋到高聳的山脈。保護自然環境對於維持生物多樣性和生態平衡至關重要。我們必須努力減少對自然資源的過度開採,並促進可持續的生活方式。

最後,藝術是表達人類情感和思想的重要方式。無論是繪畫、音樂、舞蹈還是文學,藝術以其獨特的形式激發人們的想像力和創造力。藝術不僅僅是美的追求,它還能反映社會和歷史,引發深刻的思考和對話。

通過探討這些主題,我們可以更好地理解世界,並欣賞到不同領域的豐富多樣性。無論是學習新文化,探索科技創新,欣賞自然之美,還是沉浸在藝術的世界中,我們都能從中獲得啟發和知識。這樣的探索和學習讓我們的生活更加豐富多彩,並幫助我們建立一個更加和諧、可持續的世界。

589 個繁體中文文字換算成 OpenAI 的 roken 莫是 832 tokens

以下是以 GPT-4 模型做出的估算

Tokens per executionWords per executionPrice for 1 executionOpenAI price for 10,000
executions
10075~$0.00450~$45.00
200150~$0.00900~$90.00
500375~$0.02250~$225.00
1000750~$0.04500~$450.00
20001500~$0.09000~$900.00
40003000~$0.18000~$1800.00
GPT-4

Reference

Leave a Comment

Your email address will not be published. Required fields are marked *