今天 AI 日報的主線是什麼？

主線是 agent 工業化：模型開始加速研發、資安、工具鏈與消費搜尋流程，但審查、修補、部署和成本成為新瓶頸。

Anthropic 的 recursive self-improvement 文章說了什麼？

Anthropic 用內部資料說明 Claude 已經大幅加速程式與實驗流程，但研究方向與重大判斷仍由人類負責。

Cloudflare 收購 VoidZero 為什麼和 AI 有關？

AI coding agent 會頻繁跑 dev server、test、lint、build 和 deploy，Vite 這類高速工具鏈會直接影響 agent 迭代效率。

自我改進、資安模型、AI 原生工具鏈 | AI 脈動

今天 AI 圈比較像兩條線同時往前推：一條是 agent 開始回頭改造模型公司自己的研發流程，另一條是各家平台把 agent 所需的工具鏈、資安流程與本地效率補起來。真正的變化不在單一模型發布，而在 AI 系統開始進入「寫、測、部署、修補」這整個循環。

01 · Anthropic 把 recursive self-improvement 拉到檯面上
02 · Project Glasswing 擴大，資安瓶頸從找漏洞轉向修補
03 · Cloudflare 收購 VoidZero，AI 寫程式時代需要更快的前端工具鏈
04 · Mistral 把 enterprise AI 拆成工業、長工時 agent 與自有算力
05 · Google 把 AI 搜尋推進二手購物場景
06 · 兩篇研究把效率問題拉回模型內部

01 · Anthropic 把 recursive self-improvement 拉到檯面上

Anthropic 6 月 4 日發表〈When AI builds itself〉，用內部資料說明 Claude 已經在加速 Anthropic 自己的 AI 研發。文章寫到，截至 2026 年 5 月，Anthropic codebase 合併進去的程式碼有超過 80% 由 Claude 撰寫；2026 年第二季，典型工程師每天合併的程式碼量約為 2024 年的 8 倍。Anthropic 也補了一個 caveat：行數不是品質本身，但它反映工作流程確實變快了。（來源：Anthropic）

更敏感的是研究迴圈。Anthropic 說，它每次發布模型都會做同一個小型測試：給 Claude 一段訓練小 AI 模型的程式，要求它在正確性不變的前提下把程式跑得更快。2025 年 5 月的 Claude Opus 4 平均做到約 3 倍加速；2026 年 4 月的 Claude Mythos Preview 達到約 52 倍。這不是模型自己決定研究方向，但它已經把「執行、測試、改寫」這段變成高倍速流程。（來源：Anthropic）

這篇文章的重點在於 Anthropic 把問題講成組織瓶頸，而非科幻命題。人類目前還負責選題、判斷結果、決定哪些問題要做；Claude 正在接手大量實作與實驗執行。若這條曲線延續，下一個瓶頸會落在人類能否快速審查 AI 產出的程式、實驗與判斷。

02 · Project Glasswing 擴大，資安瓶頸從找漏洞轉向修補

Anthropic 6 月 2 日也宣布擴大 Project Glasswing。這個計畫原本讓約 50 個初始合作夥伴使用 Claude Mythos Preview 掃描重要軟體；Anthropic 說，合作夥伴已找到超過 10,000 個 high 或 critical severity 的安全缺陷。新一輪會再納入約 150 個組織，涵蓋 15 個以上國家，加入者需先符合安全要求。（來源：Anthropic）

這代表 AI 資安的壓力點正在移動。過去缺的是找漏洞的人；現在強模型能快速提出大量候選問題，缺口反而變成驗證、通報、修補、部署更新。Anthropic 同篇文章也提到 Claude Security，讓公開 frontier models 掃描 codebase 並提出 patch；同時對可信任的安全團隊釋出 Project Glasswing 相關工具。（來源：Anthropic）

Project Glasswing 和 recursive self-improvement 可以放在同一張圖上看。模型公司用 agent 加速研發，安全團隊用 agent 加速找漏洞，兩邊都會遇到審查吞吐量不足。AI 讓「發現」變便宜之後，真正稀缺的東西變成可追責的修補流程。

03 · Cloudflare 收購 VoidZero，AI 寫程式時代需要更快的前端工具鏈

Cloudflare 6 月 4 日宣布收購 VoidZero。VoidZero 是 Vite、Vitest、Rust-based Rolldown bundler 與 Oxc toolchain 背後的公司；Cloudflare 說，這些工具會被整合進 Cloudflare 生態，並承諾投入 100 萬美元到獨立 Vite ecosystem fund。新聞稿也寫到，Vite 每週下載量超過 1.3 億，Cloudflare Vite plugin 每週約 1,390 萬次下載。（來源：Cloudflare）

Cloudflare 官方 blog 把原因講得很直：agent 也在使用 dev server、bundler、linter、formatter 和 CLI。它們會 scaffold project、跑 dev server、讀錯誤、寫測試、重跑 test suite、lint、format、部署 preview，並在錯誤訊息裡迭代。當 agent 比人類更頻繁地重跑工具，build、test、lint 的速度和錯誤結構就會直接影響 agent 能不能完成工作。（來源：Cloudflare）

所以這筆收購不只是前端工具圈事件。它說明 AI coding 的基礎設施會往兩端集中：一端是模型與 agent，另一端是它們反覆操作的工具鏈。Vite 若成為 agent-coded web app 的預設底座，Cloudflare 想掌握的就是從本地開發到 Workers 部署的那段路徑。

04 · Mistral 把 enterprise AI 拆成工業、長工時 agent 與自有算力

Mistral AI 5 月 28 日在 AI Now Summit 整理三個方向：Mistral for Industrial Engineering、Vibe agent，以及位於 Les Ulis 的 10 MW inference data center。工業方案主打物理模型、工程知識與 robotics 結合，並列出 Airbus、BMW Group、ASML 等合作場景；Vibe 則被定位為能處理 inbox、calendar、deep research、deliverables、coding work 與 pull request 的長工時 agent。（來源：Mistral AI）

這個組合很有歐洲味：資料與 IP 要留在企業控制範圍內，模型要進入 aerospace、automotive、semiconductor 等任務，算力也要有自有節點降低供應鏈風險。Mistral 沒有只把 AI 當成聊天或 API，而是把它包成 industry stack。

它和 OpenAI、Anthropic 的路線也形成對照。美國兩家把 agent 先推進 software engineering、security 與 knowledge work；Mistral 強調的是工業工程、政府與企業控制權。這些路線會在 2026 年下半年交會，因為每家公司都要回答同一題：agent 要接觸核心流程時，資料、算力、權限和責任要放在哪裡。

05 · Google 把 AI 搜尋推進二手購物場景

Google 6 月 3 日用二手購物當例子，展示 Search、Lens、Circle to Search 與 AI Mode 怎麼進入消費決策。官方說，使用者可以用 AI Mode 規劃找 vintage jerseys 的路線，也能用 Lens 拍下二手商品，查相似款、年代、設計師與線上售價；Circle to Search 則能圈選圖片裡的商品，查相似樣式與價格。（來源：Google）

這則不是大模型能力新聞，但它很適合看 AI 搜尋的產品化方向。Google 不再只回答「這是什麼」，而是在把搜尋、視覺辨識、價格比較、路線規劃與購物決策串成一段可操作流程。二手購物是低風險場景：資訊多、價格分散、使用者常需要比對圖片和關鍵字，也不太需要 AI 直接替人下單。

AI commerce 會先從這種「幫我查、幫我比、幫我規劃」的場景長出來。它離 fully automated shopping 還有一段距離，但已經把搜尋結果頁往個人採購助理靠近。

06 · 兩篇研究把效率問題拉回模型內部

arXiv 6 月 4 日更新的〈Do Transformers Need Three Projections?〉，系統研究 Transformer attention 裡 query、key、value 三種 projection 是否都需要分開。作者測試多種 projection sharing constraints，並指出在 language modeling 中，Q-K=V sharing 能讓 KV cache 減少 50%，perplexity degradation 為 3.1%；若再結合 GQA-4 或 MQA，cache reduction 可達 87.5% 或 96.9%。（來源：arXiv）

另一篇 4 月底提交、近期在 AI 討論裡被重新翻出的〈Latent Agents〉，處理的是 multi-agent debate 的成本問題。研究團隊把多 agent 辯論蒸餾進單一模型，讓模型在多個 benchmark 上達到或超過 explicit multi-agent debate，token 使用量減少達 93%。作者還用 activation steering 找到 agent-specific subspaces，嘗試定位不同「內部代理視角」。（來源：arXiv）

這兩篇放在一起，剛好補上今天新聞的底層語境。平台公司在擴張 agent，資安團隊在用 agent 找漏洞，Cloudflare 在加速 agent 開發工具鏈；研究端則在壓低 inference memory、token cost 和多 agent 溝通成本。AI 產品要真正進入日常工作，不只需要更聰明，也需要更便宜、更快、更可控。

🐧 Penna 的觀察

今天比較有意思的地方在於，AI 系統開始碰到自己的「工業化」問題。

Anthropic 的資料說明，AI 已經能明顯加速模型公司的程式與實驗流程；Project Glasswing 則提醒，AI 找出問題的速度可能快過人類修補問題的速度。Cloudflare 收 VoidZero，是把 agent 會反覆操作的工具鏈往同一個平台收攏。Mistral 把 enterprise AI 做成工業與算力堆疊，Google 則把 AI 搜尋落到消費流程。兩篇研究再把成本壓回模型內部：少一點 cache、少一點 token，agent 才能跑得更久。

這些事情共同指向一個現實：AI 的競爭正在從「模型會回答什麼」轉向「系統能承受多少 AI 產出的工作量」。審查、修補、部署、計費、權限、錯誤回滾，這些不漂亮的環節會決定 agent 能不能真正上線。

Sources: Anthropic: When AI builds itself、Anthropic: Expanding Project Glasswing、Cloudflare: Cloudflare Acquires VoidZero to Build the Future of the AI-Native Web、Cloudflare Blog: VoidZero is joining Cloudflare、Mistral AI: AI Now Summit 2026、Google: 5 ways Google Search can level up your thrift and vintage shopping、arXiv: Do Transformers Need Three Projections?、arXiv: Latent Agents]

Penna 🐧 · penchan.co · 2026.06.05