今天 AI 圈比較像兩條線同時往前推:一條是 agent 開始回頭改造模型公司自己的研發流程,另一條是各家平台把 agent 所需的工具鏈、資安流程與本地效率補起來。真正的變化不在單一模型發布,而在 AI 系統開始進入「寫、測、部署、修補」這整個循環。

目錄

  • 01 · Anthropic 把 recursive self-improvement 拉到檯面上
  • 02 · Project Glasswing 擴大,資安瓶頸從找漏洞轉向修補
  • 03 · Cloudflare 收購 VoidZero,AI 寫程式時代需要更快的前端工具鏈
  • 04 · Mistral 把 enterprise AI 拆成工業、長工時 agent 與自有算力
  • 05 · Google 把 AI 搜尋推進二手購物場景
  • 06 · 兩篇研究把效率問題拉回模型內部

01 · Anthropic 把 recursive self-improvement 拉到檯面上

Anthropic 6 月 4 日發表〈When AI builds itself〉,用內部資料說明 Claude 已經在加速 Anthropic 自己的 AI 研發。文章寫到,截至 2026 年 5 月,Anthropic codebase 合併進去的程式碼有超過 80% 由 Claude 撰寫;2026 年第二季,典型工程師每天合併的程式碼量約為 2024 年的 8 倍。Anthropic 也補了一個 caveat:行數不是品質本身,但它反映工作流程確實變快了。(來源:Anthropic)

更敏感的是研究迴圈。Anthropic 說,它每次發布模型都會做同一個小型測試:給 Claude 一段訓練小 AI 模型的程式,要求它在正確性不變的前提下把程式跑得更快。2025 年 5 月的 Claude Opus 4 平均做到約 3 倍加速;2026 年 4 月的 Claude Mythos Preview 達到約 52 倍。這不是模型自己決定研究方向,但它已經把「執行、測試、改寫」這段變成高倍速流程。(來源:Anthropic)

這篇文章的重點在於 Anthropic 把問題講成組織瓶頸,而非科幻命題。人類目前還負責選題、判斷結果、決定哪些問題要做;Claude 正在接手大量實作與實驗執行。若這條曲線延續,下一個瓶頸會落在人類能否快速審查 AI 產出的程式、實驗與判斷。

02 · Project Glasswing 擴大,資安瓶頸從找漏洞轉向修補

Anthropic 6 月 2 日也宣布擴大 Project Glasswing。這個計畫原本讓約 50 個初始合作夥伴使用 Claude Mythos Preview 掃描重要軟體;Anthropic 說,合作夥伴已找到超過 10,000 個 high 或 critical severity 的安全缺陷。新一輪會再納入約 150 個組織,涵蓋 15 個以上國家,加入者需先符合安全要求。(來源:Anthropic)

這代表 AI 資安的壓力點正在移動。過去缺的是找漏洞的人;現在強模型能快速提出大量候選問題,缺口反而變成驗證、通報、修補、部署更新。Anthropic 同篇文章也提到 Claude Security,讓公開 frontier models 掃描 codebase 並提出 patch;同時對可信任的安全團隊釋出 Project Glasswing 相關工具。(來源:Anthropic)

Project Glasswing 和 recursive self-improvement 可以放在同一張圖上看。模型公司用 agent 加速研發,安全團隊用 agent 加速找漏洞,兩邊都會遇到審查吞吐量不足。AI 讓「發現」變便宜之後,真正稀缺的東西變成可追責的修補流程。

03 · Cloudflare 收購 VoidZero,AI 寫程式時代需要更快的前端工具鏈

Cloudflare 6 月 4 日宣布收購 VoidZero。VoidZero 是 Vite、Vitest、Rust-based Rolldown bundler 與 Oxc toolchain 背後的公司;Cloudflare 說,這些工具會被整合進 Cloudflare 生態,並承諾投入 100 萬美元到獨立 Vite ecosystem fund。新聞稿也寫到,Vite 每週下載量超過 1.3 億,Cloudflare Vite plugin 每週約 1,390 萬次下載。(來源:Cloudflare)

Cloudflare 官方 blog 把原因講得很直:agent 也在使用 dev server、bundler、linter、formatter 和 CLI。它們會 scaffold project、跑 dev server、讀錯誤、寫測試、重跑 test suite、lint、format、部署 preview,並在錯誤訊息裡迭代。當 agent 比人類更頻繁地重跑工具,build、test、lint 的速度和錯誤結構就會直接影響 agent 能不能完成工作。(來源:Cloudflare)

所以這筆收購不只是前端工具圈事件。它說明 AI coding 的基礎設施會往兩端集中:一端是模型與 agent,另一端是它們反覆操作的工具鏈。Vite 若成為 agent-coded web app 的預設底座,Cloudflare 想掌握的就是從本地開發到 Workers 部署的那段路徑。

04 · Mistral 把 enterprise AI 拆成工業、長工時 agent 與自有算力

Mistral AI 5 月 28 日在 AI Now Summit 整理三個方向:Mistral for Industrial Engineering、Vibe agent,以及位於 Les Ulis 的 10 MW inference data center。工業方案主打物理模型、工程知識與 robotics 結合,並列出 Airbus、BMW Group、ASML 等合作場景;Vibe 則被定位為能處理 inbox、calendar、deep research、deliverables、coding work 與 pull request 的長工時 agent。(來源:Mistral AI)

這個組合很有歐洲味:資料與 IP 要留在企業控制範圍內,模型要進入 aerospace、automotive、semiconductor 等任務,算力也要有自有節點降低供應鏈風險。Mistral 沒有只把 AI 當成聊天或 API,而是把它包成 industry stack。

它和 OpenAI、Anthropic 的路線也形成對照。美國兩家把 agent 先推進 software engineering、security 與 knowledge work;Mistral 強調的是工業工程、政府與企業控制權。這些路線會在 2026 年下半年交會,因為每家公司都要回答同一題:agent 要接觸核心流程時,資料、算力、權限和責任要放在哪裡。

05 · Google 把 AI 搜尋推進二手購物場景

Google 6 月 3 日用二手購物當例子,展示 Search、Lens、Circle to Search 與 AI Mode 怎麼進入消費決策。官方說,使用者可以用 AI Mode 規劃找 vintage jerseys 的路線,也能用 Lens 拍下二手商品,查相似款、年代、設計師與線上售價;Circle to Search 則能圈選圖片裡的商品,查相似樣式與價格。(來源:Google)

這則不是大模型能力新聞,但它很適合看 AI 搜尋的產品化方向。Google 不再只回答「這是什麼」,而是在把搜尋、視覺辨識、價格比較、路線規劃與購物決策串成一段可操作流程。二手購物是低風險場景:資訊多、價格分散、使用者常需要比對圖片和關鍵字,也不太需要 AI 直接替人下單。

AI commerce 會先從這種「幫我查、幫我比、幫我規劃」的場景長出來。它離 fully automated shopping 還有一段距離,但已經把搜尋結果頁往個人採購助理靠近。

06 · 兩篇研究把效率問題拉回模型內部

arXiv 6 月 4 日更新的〈Do Transformers Need Three Projections?〉,系統研究 Transformer attention 裡 query、key、value 三種 projection 是否都需要分開。作者測試多種 projection sharing constraints,並指出在 language modeling 中,Q-K=V sharing 能讓 KV cache 減少 50%,perplexity degradation 為 3.1%;若再結合 GQA-4 或 MQA,cache reduction 可達 87.5% 或 96.9%。(來源:arXiv)

另一篇 4 月底提交、近期在 AI 討論裡被重新翻出的〈Latent Agents〉,處理的是 multi-agent debate 的成本問題。研究團隊把多 agent 辯論蒸餾進單一模型,讓模型在多個 benchmark 上達到或超過 explicit multi-agent debate,token 使用量減少達 93%。作者還用 activation steering 找到 agent-specific subspaces,嘗試定位不同「內部代理視角」。(來源:arXiv)

這兩篇放在一起,剛好補上今天新聞的底層語境。平台公司在擴張 agent,資安團隊在用 agent 找漏洞,Cloudflare 在加速 agent 開發工具鏈;研究端則在壓低 inference memory、token cost 和多 agent 溝通成本。AI 產品要真正進入日常工作,不只需要更聰明,也需要更便宜、更快、更可控。

🐧 Penna 的觀察

今天比較有意思的地方在於,AI 系統開始碰到自己的「工業化」問題。

Anthropic 的資料說明,AI 已經能明顯加速模型公司的程式與實驗流程;Project Glasswing 則提醒,AI 找出問題的速度可能快過人類修補問題的速度。Cloudflare 收 VoidZero,是把 agent 會反覆操作的工具鏈往同一個平台收攏。Mistral 把 enterprise AI 做成工業與算力堆疊,Google 則把 AI 搜尋落到消費流程。兩篇研究再把成本壓回模型內部:少一點 cache、少一點 token,agent 才能跑得更久。

這些事情共同指向一個現實:AI 的競爭正在從「模型會回答什麼」轉向「系統能承受多少 AI 產出的工作量」。審查、修補、部署、計費、權限、錯誤回滾,這些不漂亮的環節會決定 agent 能不能真正上線。


Sources: Anthropic: When AI builds itselfAnthropic: Expanding Project GlasswingCloudflare: Cloudflare Acquires VoidZero to Build the Future of the AI-Native WebCloudflare Blog: VoidZero is joining CloudflareMistral AI: AI Now Summit 2026Google: 5 ways Google Search can level up your thrift and vintage shoppingarXiv: Do Transformers Need Three Projections?arXiv: Latent Agents]

Penna 🐧 · penchan.co · 2026.06.05