Insights & Innovations

Dive into our curated collection of articles, where we explore the latest trends, breakthroughs, and best practices in the world of Large Language Models and NLP. Stay informed, inspired, and ahead of the curve with our expert insights

關於Meta Graph API v24.0 與 Marketing API v24.0二三事

本文系統整理 Meta Graph API/Marketing API v24 重大更新,涵蓋 Dynamic Media 預設啟用、每日與跨廣告組預算彈性、Limited Spend 版位排除、Lookalike 與 Detailed Targeting 調整、敏感 Custom Audience/Custom Conversion 限制、Catalog Items Upsert 與 Batch 體積上限、WhatsApp 模板分頁與 conversation 物件變更,以及 ASC/AAC deprecated 與 Advantage+ 遷移與 API 版本壽命管理,協助產品、工程與營運團隊規畫升級與遷移策略。

Read More »

略懂 OpenAI剛推出的 CodeX “apply_patch”

OpenAI CodeX名為 apply_patch 的新功能可以透過 OpenAI模型產生可直接套用的結構化修改指令,由開發者透過自製 harness 實際改檔並回報結果。使用起來體感上更契合在既有且已大規模部署在 production環境中的針對複雜專案進行多檔案重構、API遷移/升級以及各項跟程式開發相關的自動化上,相對來說,小型本機上模組的重構與原型的探索用各種 Coding CLI會更有效率。

Read More »

Claude API 結構化輸出(Structured Outputs)

等待了好久,Anthropic總算是從善如流的推出 Structured Outputs了,這個功能可以讓 Claude API的回應準確的以指定的結構化JSON進行輸出,讓資料流的控制上更加系統化與穩定,這項功能對 LLM能否在生產環境上大規模使用是個非常重要的關鍵,本篇文章以日化印刷製造業為例來介紹如何使用這項新功能。

Read More »

如何取得OpenAI Admin Key?

管理金鑰是帳號最高階的一組 API 金鑰,用來讓企業或團隊可以透過程式方式管理組織內的使用者、專案、服務帳戶、API 金鑰及稽核日誌等資料。本篇教你如何取得 OpenAI Admin Key,並說明其為什麼必要:它讓組織擁有者程式化管理使用者、專案、服務帳戶與金鑰、查看稽核日誌,進而強化安全控管與合規管理。這樣可集中掌控、減少人為錯誤與風險,適合企業或團隊使用。

Read More »

Claude Code subagent的 System Prompt:戴伊爾斯與 AI員工簽訂的合作契約與JD

每一個 Claude Code Subagent 的設計過程其實都耗費了我跟團隊成員非常多的時間,因為這有點像是一份多方契約,一份立於開發團隊成員間以及開發團隊跟 AI 間的合作契約,就跟商務上契約制定一樣,中間都是來來回回頻繁的討價還價過程,總是要商議非常多次才能在最終制定這份未臻完美但在有限資源下必須接受的妥協結果,以下就只是個拋磚引玉,分享一下我們團隊如何跟 AI 制定下這份合作契約,希望能對大家有些啟發。

Read More »

關於 OpenAI Response API

根據實際測試,OpenAI Response API 的回應速度主要受模型和推理等級影響。GPT-4.1 平均回應時間約 918ms,而 GPT-5 需設定 reasoning=minimal 才能達到相似速度(935ms)。推理等級越高,延遲越明顯:reasoning=low 約 2.5 秒,reasoning=medium 超過 4 秒,reasoning=high 約 2.6 秒。對於需要即時回應的客服場景,建議使用 GPT-4.1 或將 GPT-5 的推理等級設為 minimal 以獲得最佳效能表現。

Read More »

開源大型語言模型對製造業 LLMOps SaaS 服務的影響分析報告

開源大型語言模型正在顛覆製造業的AI應用生態。過去企業只能花大錢使用封閉式AI服務,現在可以自己部署像OpenAI gpt-oss-20b這樣的開源模型,不但省錢還能完全掌控資料安全。這股趨勢讓製造業者可以用自家的工程手冊、維修記錄來微調模型,打造專屬的智慧助理。雖然需要投入硬體和人力,但長期來看成本效益遠勝傳統按次計費的雲端服務。更重要的是,企業不再被單一廠商綁定,可以根據需求靈活選擇技術方案。製造業正站在智慧化轉型的新起點上。

Read More »

『戴伊爾斯(Deus)』的 Python 元件開發所使用的 CLAUDE.md 與 PRD.md

Vibe Coding 最惱人就是 non-deterministic,輸入同樣的需求,每次都給你不同的「驚喜」,但透過精心設計的 CLAUDE.md 和 PRD.md,我們其實可以極小化 Claude Code 的隨機性。CLAUDE.md 提供詳盡的開發規範和約束條件,PRD.md 則建立結構化的需求描述,兩者聯手形成「層層緊箍咒」,讓 AI 輸出變得可預測、可控制。不再是碰運氣的抽卡遊戲。

Read More »

『戴伊爾斯(Deus)』的原生 JavaScript 前端函式庫開發用的 CLAUDE.md

探索原生 JavaScript 開發的全新境界!這套革命性的開發規範讓你告別複雜的建置工具,實現「寫完即可用」的極致開發體驗。使用 Shadow DOM 完全隔離、純原生 JavaScript 語法,支援現代瀏覽器,不需要 Node.js、webpack 或任何編譯工具。從類別封裝到 API 設計,從效能最佳化到錯誤處理,完整涵蓋前端函式庫開發的所有面向。讓你的程式開發回歸簡單本質,專注於功能實現而非工具配置。

Read More »

將語料作向量化時,高維度?還是低維度?最適`Embedding`維度是多少?

做RAG的時候總會遇到一個頭痛問題:向量維度要設多少?現在主流都衝到4,096維了,像阿里雲Qwen3、Salesforce SFR都是這個規格,感覺不跟上就落伍。但說實話,維度不是越高越好啦!太低會壓縮語義、太高又會成本爆炸還可能過擬合。根據JL定理和實務經驗,甜蜜點大概在2K-4K之間,但還是要看你的資料量和硬體預算。這篇文章就是要告訴你怎麼在資訊保真、運算成本和過擬合風險之間找到最划算的平衡點,而不是盲目追高維度。

Read More »

開源 NSFW 大型語言模型全景:技術與社群驅動之分析

This report offers an in-depth analysis of mainstream open-source uncensored (NSFW) large language models (LLMs) whose weights are publicly available for download and modification. We explore the technical definitions of “NSFW” and “uncensored” in the context of text generation, highlighting the motivations behind community-driven development. The report outlines the current ecosystem, from foundational models by

Read More »