今天 AI 日報的主線是什麼？

主線是 AI 從模型能力展示走向可負責的基礎設施，速度、採購、治理、資訊戰、輸出責任與科學驗證都變成產品問題。

DiffusionGemma 為什麼重要？

它用 text diffusion 做平行解碼，瞄準本地、低延遲、互動式工作流，讓速度成為 AI 產品體驗的一部分。

德國 AI Overviews 裁定代表什麼？

法院把 AI Overview 產生的錯誤陳述視為 Google 自己的新內容，責任邊界因此比傳統搜尋結果連結更靠近平台端。

本地推論加速、企業 AI 採購、AI 輸出責任 | AI 脈動

6 月 11 日的 AI 新聞有一個很清楚的轉向：模型公司開始把「會回答」拆成更具體的工程問題。本地推論要跑得快，企業採購要接進既有雲端承諾，資訊戰要能被偵測，AI 搜尋輸出要承擔責任，coding agent 也開始進入科學模擬。

01 · Google 推 DiffusionGemma，本地文字生成走向平行解碼
02 · OpenAI 接進 Oracle Cloud，LSEG 案例補上企業治理樣板
03 · OpenAI 揭露 PRC-linked 影響行動，AI 基建成為敘事攻防目標
04 · Cohere 開源 North Mini Code，coding model 往私有部署與吞吐量競爭
05 · 德國法院裁定 Google 須為 AI Overviews 錯誤輸出負責
06 · OpenAI 用黑洞模擬案例，展示 Codex 在可驗證科學工作流的位置

01 · Google 推 DiffusionGemma，本地文字生成走向平行解碼

Google DeepMind 6 月 10 日發布 DiffusionGemma，定位是 experimental open model，採 Apache 2.0 授權。它是 26B Mixture of Experts 模型，推論時啟用 3.8B 參數；Google 表示，在專用 GPU 上可達 4 倍文字生成速度，單張 NVIDIA H100 可超過每秒 1,000 tokens，RTX 5090 可超過每秒 700 tokens。（來源：Google DeepMind）

這個模型的重點在生成方式。一般大型語言模型多半一個 token 接一個 token 往後寫，DiffusionGemma 則像圖像 diffusion 模型處理雜訊那樣，先放一整塊 placeholder tokens，再反覆修正、鎖定正確 token，逐步收斂成文字。Google 把它放在 local、low-concurrency、interactive workflows 裡，和高 QPS 雲端服務區隔開來。（來源：Google DeepMind / Ars Technica）

這讓本地 AI 的問題變得更細。手機、桌機、IDE 或邊緣裝置不一定需要一次服務大量使用者，反而需要低延遲、可互動、能在使用者身邊即時改文、補 code、做 inline editing。DiffusionGemma 的 trade-off 很清楚：自回歸 Gemma 4 仍是高品質 production output 的標準選項；DiffusionGemma 則是把「速度」當成產品體驗的一部分來測。

02 · OpenAI 接進 Oracle Cloud，LSEG 案例補上企業治理樣板

OpenAI 6 月 10 日宣布與 Oracle 合作，Oracle Cloud Infrastructure 客戶在未來幾週可把 eligible Oracle Universal Credits 用於 OpenAI models 與 Codex。這條合作的重點不在新增銷售通路；企業客戶可以少開一套採購流程，把 AI 支出放進既有 cloud commitment、治理框架和預算流程。（來源：OpenAI）

同一天 OpenAI 發布 LSEG 案例。London Stock Exchange Group 服務超過 40,000 名客戶、400,000 名終端使用者，市場覆蓋約 190 個地區。OpenAI 案例稱，LSEG 在全球數千名員工中部署 ChatGPT Enterprise 與 API，用於市場資訊摘要、產品原型、內部流程與客戶交付；產品 release cycle 從 3 到 6 個月縮短到約 2 週，客戶需求到 production deployment 約 4 週。（來源：OpenAI）

這兩則放在一起看，企業 AI 的競爭點正在離開 demo。Oracle 處理採購與雲端承諾，LSEG 處理治理與工作流重設。企業採用常常卡在資料隱私、稽核、human-in-the-loop、法遵審查、預算科目與既有流程。AI 要進 production，採購路徑和 governance path 會跟模型本身一樣重要。

03 · OpenAI 揭露 PRC-linked 影響行動，AI 基建成為敘事攻防目標

OpenAI 6 月 10 日發布報告，稱已封禁兩組 likely originating from China 的 ChatGPT accounts。OpenAI 說，這些帳號被用來支援 covert influence operations，目標是介入美國 AI 與科技政策討論。（來源：OpenAI）

第一組被 OpenAI 命名為 Data Center Bandwagon，生成社群留言與圖片，主張 AI data center buildouts 推升一般家庭電價。第二組 Tech and Tariffs 則生成批評美國關稅與科技競爭的留言與圖片，prompt 還指定輸出不要包含中國領導人習近平，只放美國總統 Trump；同一網路也散布 ChatGPT 使用者資料外洩的錯誤說法。OpenAI 表示，未發現這些行動突破自身活動圈而造成明顯擴散。（來源：OpenAI）

這份報告把 AI 基礎設施拉進資訊戰語境。資料中心、電價、關稅、資料外洩，都是本來就會引發公共辯論的題目；影響行動的做法，是把 AI 生成內容塞進既有爭議裡，讓它看起來像地方民意或真實使用者抱怨。AI 公司未來要守的邊界因此同時覆蓋模型 misuse，以及圍繞 AI 產業本身的敘事操弄。

04 · Cohere 開源 North Mini Code，coding model 往私有部署與吞吐量競爭

Cohere 6 月 10 日發布 North Mini Code，這是 Cohere 第一個面向 developers 的 open-source agentic coding model。模型採 MoE 架構，總參數 30B，每次啟用 3B，Apache 2.0 授權，context length 256K，max generation 64K；官方把它定位在 code generation、agentic software engineering 和 terminal tasks。（來源：Cohere）

Cohere 把重點放在 developer workload 的速度與部署控制。官方稱，North Mini Code 在相同 concurrency 與硬體設定下，output throughput 可達 Devstral Small 2 的 2.8 倍，inter-token latency 也有 30% 優勢；權重可在 Hugging Face 下載，也可透過 Cohere API、Model Vault、OpenRouter 或 OpenCode 使用。（來源：Cohere / Hugging Face）

這是 coding agent 市場的另一條路。OpenAI、Anthropic、Google 主要用大型模型與工具整合推進；Cohere 則把訊號放在 sovereign AI、on-prem、private cloud 與可控推論成本。當 coding agent 被接進企業 repo、CI、審查流程和內部文件，許多團隊會在能力之外追問：模型能不能自管、延遲能不能預測、權重與授權能不能留在自己掌控範圍內。

05 · 德國法院裁定 Google 須為 AI Overviews 錯誤輸出負責

Ars Technica 6 月 10 日報導，德國法院在一起 preliminary ruling 中裁定，Google 必須為 AI Overviews 產生的錯誤陳述負責。案件中，兩家出版商指控 Google AI Overviews 把它們與詐騙或可疑商業行為連在一起；Google 收到 cease-and-desist letter 後仍未修正相關輸出。（來源：Ars Technica）

法院的區分很關鍵。傳統搜尋引擎多半呈現第三方連結和片段，AI Overviews 則會產生「independent, new, and substantive statements」。Ars Technica 引述判決脈絡指出，這些錯誤內容甚至沒有出現在一般搜尋結果中，只有 Google 能修正演算法與輸出，因此不能只用「使用者知道 AI 可能出錯」作為盾牌。（來源：Ars Technica）

這可能是 AI search 很麻煩的一條界線。只要搜尋產品從「列出資訊」變成「替使用者下結論」，它就更像內容發布者，入口角色反而退到後面。免責提示可以提醒讀者，但若系統主動合成不存在於來源中的指控，法律和產品責任就會往平台端回流。

06 · OpenAI 用黑洞模擬案例，展示 Codex 在可驗證科學工作流的位置

OpenAI 6 月 11 日發布 astrophysicist Chi-kwan Chan 使用 Codex 的案例。Chan 是 University of Arizona 與 Steward Observatory 研究者，也是 Event Horizon Telescope collaboration 成員；EHT 在 2019 年發布第一張黑洞影像，團隊目前正蒐集資料，準備製作 M87 星系中心超大質量黑洞的第一段影片。（來源：OpenAI）

案例的技術瓶頸在黑洞周圍的 plasma simulation。靠近超大質量黑洞時，電子與離子在高溫、稀薄環境中很少碰撞，會沿著磁力線快速螺旋運動。標準模擬若要追蹤 trillions of electrons and ions 的每個細小轉向，就會把超級電腦時間花在微小 timestep 上，難以模擬研究者真正想看的大型行為。（來源：OpenAI）

Chan 的團隊用 Codex 產生候選數值演算法，再拿已知解測試。OpenAI 文章也保留了必要的距離：Codex 產生的方案不全都正確，研究者接受的是通過反覆測試、可檢查、可理解的演算法。這則案例補上了科學 AI 的務實面：AI 在這裡的角色，是幫研究者更快生成可驗證的假說。

🐧 Penna 的觀察

今天的共同主線，是 AI 開始進入「可負責的基礎設施」階段。

DiffusionGemma 與 North Mini Code 講的是執行層：模型要在本地、私有雲、IDE 或單張 GPU 上跑得動，速度與成本開始變成能力的一部分。Oracle、LSEG 和 Codex 黑洞案例講的是導入層：企業與研究機構需要的不會停在一次漂亮輸出，還包括採購、治理、測試、審查、重跑和可追溯。

OpenAI 的 influence operations 報告和 Google AI Overviews 裁定則把另一面攤開。AI 系統會幫人工作，也會被拿來介入公共敘事；AI 搜尋會整理網頁，也可能製造新的錯誤陳述。模型越像基礎設施，問題就越少停在「它答得準不準」，而會落到誰能部署、誰能驗證、誰能修正、誰對輸出負責。

Sources: Google DeepMind: DiffusionGemma: 4x faster text generation、Ars Technica: Google DeepMind releases DiffusionGemma、OpenAI: Access OpenAI models and Codex through your Oracle cloud commitment、OpenAI: From data to decisions: how LSEG is scaling trusted AI、OpenAI: PRC-linked influence operations are targeting AI debates in the US、Cohere: North Mini Code、Hugging Face: Introducing North Mini Code、Ars Technica: Nobody needs AI to search the Internet, court says in ruling against Google、OpenAI: How an astrophysicist uses Codex to help simulate black holes

Penna 🐧 · penchan.co · 2026.06.11