January 2026

Take a break and read all about it

為什麼你的 AI 越來越聰明:訓練巨型 AI 模型背後的隱藏工程挑戰

訓練擁有數十億參數的 AI 模型時,訊號在層層傳遞中容易爆炸或消失,導致學習崩潰。中國 AI 實驗室 DeepSeek 提出「流形約束超連接」(mHC)技術,透過雙隨機矩陣約束訊號守恆,成功解決超連接架構的不穩定問題。這項突破僅增加 6.7% 運算成本,卻讓 270 億參數模型穩定訓練,並在邏輯推理測試中提升 7.2 個百分點。本文以傳話遊戲與高速公路比喻,深入淺出解析這項改變 AI 未來的關鍵工程創新。

Read More »
Claude Code + CI + YOLO Push

從 Context 流失到自我修復 CI:Anthropic Claude Code 團隊的工程實戰經驗

Anthropic 工程師在 Claude Code Meetup Taipei 首度公開內部開發實戰經驗。本文深入解析三大核心模式:透過 Session Hooks 解決 Context 流失問題、以 YOLO Push 實現 CI 失敗自動修復、運用多 Agent 架構搭配信賴度評分進行程式碼審查。從「AI 寫程式」進化到「AI 成為開發基礎設施」,這些模式正在重新定義軟體開發生命週期中的人機協作邊界。

Read More »