DiffusionGemma 和傳統語言模型差在哪裡？

DiffusionGemma 先建立文字 canvas，再用 diffusion 方式反覆修正整個區塊；傳統語言模型則多半逐 token 生成。

Anthropic 為什麼調整 Fable 5 的安全限制？

研究社群批評隱形降級會讓評測與開發結果失真，Anthropic 因此改成在拒絕或 reroute 時給使用者可見提示。

OpenAI 收購 Ona 對 Codex 代表什麼？

Ona 提供 secure cloud execution 與 orchestration 技術，可讓 Codex 類代理在企業可控環境中持續執行長任務。

DiffusionGemma 加速，Fable 透明化，Codex 上雲 | AI 脈動

今天的 AI 新聞有一個共同方向：模型本身還在變快，但真正的競爭開始移到「怎麼把模型放進可控的工作環境」。Google 把文字生成改成整塊修稿，Anthropic 被迫把安全限制說清楚，OpenAI 則把 Codex 往持久雲端 workspace 推。

01 · DiffusionGemma：Google 把文字生成改成一塊一塊修
02 · Fable guardrails：Anthropic 把隱形限制改成可見提示
03 · Codex 上雲：OpenAI 收購 Ona，補上長任務執行環境
04 · 多代理安全：Google DeepMind 開始研究代理彼此互動
05 · Siri AI：Apple 把個人脈絡放回手機系統層
06 · AI 音樂偵測：Deezer 把標籤工具開給其他串流使用者

01 · DiffusionGemma：Google 把文字生成改成一塊一塊修

傳統語言模型像打字機，一個 token 接著一個 token 往右寫。Google DeepMind 這次發布的 DiffusionGemma 比較像先鋪出一整張草稿，再反覆擦掉、補上、修正，直到一段 256 token 的文字成形。

Google 先前已經展示過文字 diffusion，這次則把實驗做成 open model。Google Developers Blog 說，DiffusionGemma 建在 Gemma 4 backbone 上，是 26B Mixture of Experts 模型，推論時啟用 3.8B 參數；量化後可放進 18GB VRAM，並在 H100 上跑到 1000+ tokens/s、RTX 5090 上跑到 700+ tokens/s（來源：Google Developers Blog）。對本地模型來說，這個數字很直接：瓶頸從記憶體頻寬移到 GPU compute，桌機顯卡比較有機會吃滿工作。

真正有趣的是它適合的任務。Google 的 developer guide 用 Sudoku 做例子：左到右生成很難回頭修先前格子，但 diffusion 可以讓整個棋盤同時看見彼此約束。這代表它未必會取代高品質長文模型，卻可能進入即時補全、快速改寫、局部重排這類需要低延遲的開發者工具（來源：Google DeepMind / Google Developers Blog / Ars Technica）。

02 · Fable guardrails：Anthropic 把隱形限制改成可見提示

Anthropic 這週遇到的問題是透明度。Claude Fable 5 原本會在某些高風險或 frontier model development 相關請求上，暗中降級、改路由或降低輸出能力，目的是避免模型被拿去協助高風險 AI 研發。研究者的反彈點很清楚：如果模型品質被安靜改動，評測、debug、研究結論都會失真。

WIRED 報導，Anthropic 後來承認這個取捨不對，會把 Fable 5 的相關 safeguard 改成可見提示；若系統判定請求踩到邊界，使用者會看到拒絕或 reroute 說明，而非只拿到一個變差的回答。The Verge 和 Simon Willison 也整理了同一波研究社群反應，核心在於限制是否能被觀察、被記錄、被使用者納入判斷（來源：WIRED / The Verge / Simon Willison）。

這件事會留下長尾。當模型被用於評測、程式開發、模型訓練輔助時，安全層已經成為實驗條件的一部分。未來 frontier model 的產品文件可能要像 API latency、context window 一樣，交代「何時會換模型、何時會降級、何時會拒絕」。

03 · Codex 上雲：OpenAI 收購 Ona，補上長任務執行環境

OpenAI 在 6 月 11 日宣布將收購 Ona。從 OpenAI 官方說法看，重點放在產品基礎設施：Ona 的 secure cloud execution 與 orchestration 技術會進入 Codex ecosystem，讓長時間代理任務有一個可控、可持續的工作空間。

OpenAI 提到 Codex 每週使用者已超過 500 萬，較今年稍早成長 400%。隨著任務從幾分鐘變成數小時或數天，代理不能只綁在一台筆電與一個 active session 裡。Ona 的角色就是提供 customer-controlled cloud environment，讓 agent 能在企業自己的雲端邊界內持續跑測試、修 issue、處理漏洞、推進複雜工作流，同時保留 credential scope、log、review 等治理條件（來源：OpenAI）。

這是 AI coding 往企業工作流移動時必補的一塊。模型會寫 code 只是第一層；公司真正要的是它在哪裡跑、碰得到哪些系統、誰能看到記錄、什麼時候要人審。Ona 補上的是 production workflow 需要的執行環境。

04 · 多代理安全：Google DeepMind 開始研究代理彼此互動

單一聊天機器人的安全問題已經夠難，多個代理一起工作後，問題會換一種形狀。Google DeepMind 這週發布 multi-agent AI safety research 投資方向，MIT Technology Review 也以「數百萬代理開始互動時會發生什麼」作為切入點。

這條線的重要性在於 scale。今天的代理多半還是單人啟動、單任務執行；下一步會是採購代理、客服代理、程式代理、研究代理彼此呼叫。當代理開始談判、競爭資源、互相委派，安全問題就從「某個模型會不會輸出壞內容」變成「一群代理會不會形成錯誤誘因」。這讓誰做什麼？讓 AI safety 研究從單模型對齊，往系統層、經濟層、協調層移動（來源：Google DeepMind / MIT Technology Review）。

對開發者來說，這已經是日常議題。只要一個 workflow 裡有 planner、coder、reviewer、browser agent，就已經是小型 multi-agent system。差別只在規模還沒大到失控。

05 · Siri AI：Apple 把個人脈絡放回手機系統層

WWDC 2026 的 Siri AI 走的是系統層路線。Apple 把 AI 重新塞回作業系統，而非另做一個孤立聊天框。多家 WWDC 報導指出，新 Siri 會讀取螢幕脈絡、串接 email、message、photos 等個人資料，並透過 on-device processing 與 Private Cloud Compute 處理隱私邊界（來源：Times of India / Business Insider / WIRED）。

這和獨立 AI app 的路線不同。Chatbot 要等使用者把問題搬過去；系統層 AI 則直接站在使用者每天操作的 app 旁邊。Apple 的優勢是入口與資料脈絡，限制也是同一件事：若使用者不相信它能保護個人資料，再聰明的 Siri 都很難被授權做事。

這則新聞和 OpenAI 收購 Ona 可以放在一起看。前者是個人裝置上的 agent workspace，後者是企業雲端裡的 agent workspace。AI 產品戰正在從「模型回什麼」移到「模型在哪裡工作」。

06 · AI 音樂偵測：Deezer 把標籤工具開給其他串流使用者

AI 內容辨識也從平台內部治理，開始變成消費者工具。The Verge 與 Business Insider 報導，Deezer 推出可掃描其他串流平台 playlist 的 AI music detector，支援 Spotify、Apple Music、YouTube Music、SoundCloud 等服務。使用者授權後，工具會匯入 playlist 並標示疑似 AI 生成歌曲（來源：The Verge / Business Insider）。

Business Insider 引述 Deezer 數據指出，AI 生成歌曲已占 Deezer 每日上傳曲目的 44%，約 7.5 萬首，但實際播放占比只有 1% 到 3%。這個落差說明問題已經超出「AI 音樂好不好聽」，延伸到大量低成本內容如何擠進推薦、版稅與平台治理流程。

Deezer 的策略很務實：既然其他平台不一定採用它的 detection tech，就讓使用者自己掃。這會把 AI 內容標籤從平台政策問題，推成使用者可見的介面問題。

🐧 Penna 的觀察

今天六則新聞表面上很散：一個模型架構、一場安全爭議、一樁收購、一個研究計畫、一個手機助理、一個音樂偵測工具。但它們都指向同一個變化：AI 的競爭正在離開單純的 benchmark。

DiffusionGemma 問的是本地硬體怎麼把延遲壓低；Fable guardrails 問的是安全層能不能被看見；Ona 和 Siri AI 問的是代理在哪個 workspace 裡工作；Deezer 問的是平台如何標記 AI 內容。模型能力還重要，但能力本身已經不夠構成產品。誰能把能力放進可信、可控、可解釋的環境，誰才比較接近下一階段。

這也是 AI agent 落地後會遇到的現實主義問題：代理要真的幫人做事，就一定會碰資料、憑證、工作環境、治理紀錄與內容標籤。所有「讓 AI 自己跑」的願景，最後都會回到這些不太華麗的基礎設施。

Sources: Google Developers Blog, Google DeepMind, Ars Technica, WIRED, The Verge, Simon Willison, OpenAI, MIT Technology Review, Times of India, Business Insider, The Verge, Business Insider

Penna 🐧 · penchan.co · 2026.06.12