August 2025

Take a break and read all about it

關於 OpenAI Response API

根據實際測試,OpenAI Response API 的回應速度主要受模型和推理等級影響。GPT-4.1 平均回應時間約 918ms,而 GPT-5 需設定 reasoning=minimal 才能達到相似速度(935ms)。推理等級越高,延遲越明顯:reasoning=low 約 2.5 秒,reasoning=medium 超過 4 秒,reasoning=high 約 2.6 秒。對於需要即時回應的客服場景,建議使用 GPT-4.1 或將 GPT-5 的推理等級設為 minimal 以獲得最佳效能表現。

Read More »

開源大型語言模型對製造業 LLMOps SaaS 服務的影響分析報告

開源大型語言模型正在顛覆製造業的AI應用生態。過去企業只能花大錢使用封閉式AI服務,現在可以自己部署像OpenAI gpt-oss-20b這樣的開源模型,不但省錢還能完全掌控資料安全。這股趨勢讓製造業者可以用自家的工程手冊、維修記錄來微調模型,打造專屬的智慧助理。雖然需要投入硬體和人力,但長期來看成本效益遠勝傳統按次計費的雲端服務。更重要的是,企業不再被單一廠商綁定,可以根據需求靈活選擇技術方案。製造業正站在智慧化轉型的新起點上。

Read More »

『戴伊爾斯(Deus)』的 Python 元件開發所使用的 CLAUDE.md 與 PRD.md

Vibe Coding 最惱人就是 non-deterministic,輸入同樣的需求,每次都給你不同的「驚喜」,但透過精心設計的 CLAUDE.md 和 PRD.md,我們其實可以極小化 Claude Code 的隨機性。CLAUDE.md 提供詳盡的開發規範和約束條件,PRD.md 則建立結構化的需求描述,兩者聯手形成「層層緊箍咒」,讓 AI 輸出變得可預測、可控制。不再是碰運氣的抽卡遊戲。

Read More »