
Gemini 3.1 Pro Model Card — Benchmark 解析筆記
Google DeepMind 發布 Gemini 3.1 Pro Model Card,我們逐一拆解 16 個 Benchmark 的創建者/單位、評測方法與跨模型分數,搭配 SOTA安全評估解讀,幫你看懂 AI 模型競爭格局的真實面貌。

Google DeepMind 發布 Gemini 3.1 Pro Model Card,我們逐一拆解 16 個 Benchmark 的創建者/單位、評測方法與跨模型分數,搭配 SOTA安全評估解讀,幫你看懂 AI 模型競爭格局的真實面貌。

每個 AI agent 都有同一種病:越強大,context window 越髒,表現反而越差。Anthropic、Cloudflare、Google 和 OpenAI 不約而同收斂到同一個解法:程式化工具調用。這篇文章拆解這場從 prompt engineering 到 context engineering 的典範轉移,以及對所有正在打造 AI 驅動系統的人意味著什麼。

一位奧地利獨立開發者打造的開源 AI agent「OpenClaw」,短短數週內席捲全球開發社群,GitHub 星數突破 13.5 萬、引發 Mac mini 搶購潮,甚至催生出一個擁有 77 萬自主機器人的社交網路。面對 Meta 與 OpenAI 的競相招攬,創作者 Peter Steinberger 選擇加入 OpenAI,並將 OpenClaw 轉型為獨立基金會。這則故事揭示的不只是一場人才收購——而是自主代理時代的安全斷層線、「建造者身份」作為新競爭優勢的崛起,以及為什麼在 AI 能執行一切的世界裡,品味與判斷力才是真正無可取代的人類籌碼。

台灣親屬稱謂計算器 Web Component 的開發提示詞紀錄,涵蓋核心邏輯、無限世代演算法、元件封裝與母系親屬修正等四個開發階段的完整歷程。