Deus Blog

OpenAI Batch API 技術與實務面的經驗分享

Sean Liu | CEO April 20, 2025

OpenAI Batch API 打破即時呼叫侷限，以非同步批次處理方式讓你一次併發上萬筆請求，並在最長 24 小時內回傳結果。本文深入解析核心運作機制、成本折扣優勢與實務應用場景，並附上 Python 範例與測試建議，助你輕鬆掌握大規模 AI 推理的高效利器。

OpenAI 最新 Flex Processing對 LLMOps 與 AgenticOps SaaS 的影響

Sean Liu | CEO April 19, 2025

OpenAI 在 2025 年 4 月推出了全新的 Flex 處理（Flex Processing）功能，允許開發者以更低的成本使用大型語言模型，但代價是處理速度較慢且資源可用性不穩定。這項功能主要針對非即時、低優先級的工作負載，例如模型評估、大規模資料處理或非同步任務等。本文將從成本、技術實務到商業策略等七個面向，深入說明 Flex 處理對大型語言模型營運（LLMOps）與代理型 AI 營運（AgenticOps）相關的 SaaS 平台所帶來的影響與最佳實務建議。

LLM-enabled 客服系統 LLM token fee 估算

Sean Liu | CEO March 14, 2025

以下是關於 GPT-4o、GPT-4o-mini、GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 等模型的成本估算，以心臟外科 AI 助手作為編列預算參考。

略懂 DeepSeek 模型的數據精度格式與混合精度訓練策略

Sean Liu | CEO February 18, 2025

DeepSeek 模型採用創新的混合精度訓練策略，靈活運用 FP8、BF16、FP32 等不同精度格式。其核心技術包括精度解耦、自動縮放、細粒度量化和遞增累加精度等方法，在保持模型穩定性同時大幅降低算力成本。這套策略讓 DeepSeek-V2 預訓練成本僅需 557.6 萬美元，遠低於同級模型，同時維持優異性能表現。

關於 OpenAI 的 Deep Research

Sean Liu | CEO February 3, 2025

OpenAI 在 2025 年 2 月推出的「深度研究」功能，是一個重大的技術突破。這個系統能在 30 分鐘內完成需要人類花費數小時的研究工作。它建立在最新的 o3 模型上，具備動態推理和跨模態分析能力。系統可以自動瀏覽網路、分析資料，並產生完整的研究報告。值得注意的是，它的引證準確率達到 92%，比以前的模型提升了 37%。這項技術預計會重新定義專業研究的範圍，為知識工作帶來革命性的改變。

智慧成長的極限：AI 長鏈思考遇到的瓶頸

Sean Liu | CEO February 2, 2025

從 AlphaZero 的棋盤奇蹟到 o1 推理引擎的突破，AI 的發展似乎正面臨認知極限。這篇文章探討了當代 AI 在開放性問題中的推理困境，從強化學習的領域限制到長鏈思考的瓶頸。透過分析 OpenAI、DeepMind 等領先研究機構的最新進展，我們看到 AI 技術在特定領域的璀璨成就，也發現了現有架構難以跨越的認知邊界。在探索突破方向時，或許應該重新思考：真正的認知革命，會是漸進改良還是範式轉移？

Instruction Hierarchy：提升安全性和可控性的新架構

Sean Liu | CEO February 1, 2025

為了解決大型語言模型容易受到惡意攻擊的問題，OpenAI 團隊提出了一個全新的「指令層級」架構。這個架構把指令分成四個優先級：系統訊息、使用者訊息、多媒體指令和工具輸出。透過這樣的分級，模型就能知道該聽哪一個指令，有效防止低優先級的指令蓋掉高優先級的指令。實驗結果顯示，這個方法不只提升了模型的安全性，還能保留原有的功能。對於未來 AI 安全的發展來說，這是一個很重要的突破。

OpenAI o3-mini：安全跟能力一起進步的新一代語言模型

Sean Liu | CEO February 1, 2025

OpenAI 最新發表的 o3-mini 系統規格說明文件，為 AI 安全與效能的平衡樹立了新標竿。這個模型透過思維鏈和審議對齊技術，在回答問題前會先做安全評估，大幅提升了抵抗越獄攻擊的能力。文件詳細說明了多層次的安全測試機制，包括內部評估、紅隊測試和風險分級，同時也展示了 o3-mini 在多語言處理和程式開發等實際應用上的突破。這份完整的技術分析不只說明了目前的成果，也指出了未來發展的方向和挑戰。

超極速的看一下 OpenAI o3-mini

Sean Liu | CEO February 1, 2025

OpenAI 最新推出的 o3-mini 模型在 STEM（科學、數學、工程等）領域帶來了重大突破。這個模型不只在成本效益和運算速度上有明顯提升，在處理複雜的科學和數學問題時也展現出很強的實力。透過可調整的推理強度，使用者可以根據需求在速度和準確度之間取得平衡。特別值得一提的是，這是第一個同時開放給付費和免費使用者的推理模型，大幅降低了 AI 技術的使用門檻，為未來 AI 的普及化開啟了新的可能。

AI consciousness：如果 AI 能夠寫出這樣優美的論述…

Sean Liu | CEO January 31, 2025

如果意識只是演化的一個偶然，而宇宙本身也沒有任何意義的話，那為什麼人類還是那麼執著於追求目的的虛幻呢？明明知道這些目的都是自己想出來的。這是不是就像在對著一個冷漠的虛無空間，演出一場存在主義的戲劇？

美國科技出口管制的三個面向：從晶片戰到AI生態系的權力重組

Sean Liu | CEO January 29, 2025

這篇深度分析文章探討美國對中國的科技出口管制策略，從過去的政策演變到當前的效能落差，再到未來的生態系影響。文章特別討論了 NVIDIA 晶片限制帶來的影響、中國企業的因應之道，以及 AI 產業可能面臨的轉變。透過分析運算能力差距、記憶體技術限制和雲端服務的替代方案，帶讀者了解這場科技戰背後的深層意義，以及對全球 AI 發展版圖的重大影響。

從軟體到深科技：獨角獸的演進與下一波創業潮

Sean Liu | CEO January 29, 2025

深科技通常指的是具有重大科學或工程突破的新創企業，包含半導體、量子計算、生物科技、先進材料、先進能源、機器人技術等。相較於早期基於軟體應用的創新，深科技更依賴長期研發與實驗，但一旦取得突破，則對整個產業具有顛覆性影響。

Insights & Innovations