6 月 11 日的 AI 新聞有一個很清楚的轉向:模型公司開始把「會回答」拆成更具體的工程問題。本地推論要跑得快,企業採購要接進既有雲端承諾,資訊戰要能被偵測,AI 搜尋輸出要承擔責任,coding agent 也開始進入科學模擬。

目錄

  • 01 · Google 推 DiffusionGemma,本地文字生成走向平行解碼
  • 02 · OpenAI 接進 Oracle Cloud,LSEG 案例補上企業治理樣板
  • 03 · OpenAI 揭露 PRC-linked 影響行動,AI 基建成為敘事攻防目標
  • 04 · Cohere 開源 North Mini Code,coding model 往私有部署與吞吐量競爭
  • 05 · 德國法院裁定 Google 須為 AI Overviews 錯誤輸出負責
  • 06 · OpenAI 用黑洞模擬案例,展示 Codex 在可驗證科學工作流的位置

01 · Google 推 DiffusionGemma,本地文字生成走向平行解碼

Google DeepMind 6 月 10 日發布 DiffusionGemma,定位是 experimental open model,採 Apache 2.0 授權。它是 26B Mixture of Experts 模型,推論時啟用 3.8B 參數;Google 表示,在專用 GPU 上可達 4 倍文字生成速度,單張 NVIDIA H100 可超過每秒 1,000 tokens,RTX 5090 可超過每秒 700 tokens。(來源:Google DeepMind)

這個模型的重點在生成方式。一般大型語言模型多半一個 token 接一個 token 往後寫,DiffusionGemma 則像圖像 diffusion 模型處理雜訊那樣,先放一整塊 placeholder tokens,再反覆修正、鎖定正確 token,逐步收斂成文字。Google 把它放在 local、low-concurrency、interactive workflows 裡,和高 QPS 雲端服務區隔開來。(來源:Google DeepMind / Ars Technica)

這讓本地 AI 的問題變得更細。手機、桌機、IDE 或邊緣裝置不一定需要一次服務大量使用者,反而需要低延遲、可互動、能在使用者身邊即時改文、補 code、做 inline editing。DiffusionGemma 的 trade-off 很清楚:自回歸 Gemma 4 仍是高品質 production output 的標準選項;DiffusionGemma 則是把「速度」當成產品體驗的一部分來測。

02 · OpenAI 接進 Oracle Cloud,LSEG 案例補上企業治理樣板

OpenAI 6 月 10 日宣布與 Oracle 合作,Oracle Cloud Infrastructure 客戶在未來幾週可把 eligible Oracle Universal Credits 用於 OpenAI models 與 Codex。這條合作的重點不在新增銷售通路;企業客戶可以少開一套採購流程,把 AI 支出放進既有 cloud commitment、治理框架和預算流程。(來源:OpenAI)

同一天 OpenAI 發布 LSEG 案例。London Stock Exchange Group 服務超過 40,000 名客戶、400,000 名終端使用者,市場覆蓋約 190 個地區。OpenAI 案例稱,LSEG 在全球數千名員工中部署 ChatGPT Enterprise 與 API,用於市場資訊摘要、產品原型、內部流程與客戶交付;產品 release cycle 從 3 到 6 個月縮短到約 2 週,客戶需求到 production deployment 約 4 週。(來源:OpenAI)

這兩則放在一起看,企業 AI 的競爭點正在離開 demo。Oracle 處理採購與雲端承諾,LSEG 處理治理與工作流重設。企業採用常常卡在資料隱私、稽核、human-in-the-loop、法遵審查、預算科目與既有流程。AI 要進 production,採購路徑和 governance path 會跟模型本身一樣重要。

03 · OpenAI 揭露 PRC-linked 影響行動,AI 基建成為敘事攻防目標

OpenAI 6 月 10 日發布報告,稱已封禁兩組 likely originating from China 的 ChatGPT accounts。OpenAI 說,這些帳號被用來支援 covert influence operations,目標是介入美國 AI 與科技政策討論。(來源:OpenAI)

第一組被 OpenAI 命名為 Data Center Bandwagon,生成社群留言與圖片,主張 AI data center buildouts 推升一般家庭電價。第二組 Tech and Tariffs 則生成批評美國關稅與科技競爭的留言與圖片,prompt 還指定輸出不要包含中國領導人習近平,只放美國總統 Trump;同一網路也散布 ChatGPT 使用者資料外洩的錯誤說法。OpenAI 表示,未發現這些行動突破自身活動圈而造成明顯擴散。(來源:OpenAI)

這份報告把 AI 基礎設施拉進資訊戰語境。資料中心、電價、關稅、資料外洩,都是本來就會引發公共辯論的題目;影響行動的做法,是把 AI 生成內容塞進既有爭議裡,讓它看起來像地方民意或真實使用者抱怨。AI 公司未來要守的邊界因此同時覆蓋模型 misuse,以及圍繞 AI 產業本身的敘事操弄。

04 · Cohere 開源 North Mini Code,coding model 往私有部署與吞吐量競爭

Cohere 6 月 10 日發布 North Mini Code,這是 Cohere 第一個面向 developers 的 open-source agentic coding model。模型採 MoE 架構,總參數 30B,每次啟用 3B,Apache 2.0 授權,context length 256K,max generation 64K;官方把它定位在 code generation、agentic software engineering 和 terminal tasks。(來源:Cohere)

Cohere 把重點放在 developer workload 的速度與部署控制。官方稱,North Mini Code 在相同 concurrency 與硬體設定下,output throughput 可達 Devstral Small 2 的 2.8 倍,inter-token latency 也有 30% 優勢;權重可在 Hugging Face 下載,也可透過 Cohere API、Model Vault、OpenRouter 或 OpenCode 使用。(來源:Cohere / Hugging Face)

這是 coding agent 市場的另一條路。OpenAI、Anthropic、Google 主要用大型模型與工具整合推進;Cohere 則把訊號放在 sovereign AI、on-prem、private cloud 與可控推論成本。當 coding agent 被接進企業 repo、CI、審查流程和內部文件,許多團隊會在能力之外追問:模型能不能自管、延遲能不能預測、權重與授權能不能留在自己掌控範圍內。

05 · 德國法院裁定 Google 須為 AI Overviews 錯誤輸出負責

Ars Technica 6 月 10 日報導,德國法院在一起 preliminary ruling 中裁定,Google 必須為 AI Overviews 產生的錯誤陳述負責。案件中,兩家出版商指控 Google AI Overviews 把它們與詐騙或可疑商業行為連在一起;Google 收到 cease-and-desist letter 後仍未修正相關輸出。(來源:Ars Technica)

法院的區分很關鍵。傳統搜尋引擎多半呈現第三方連結和片段,AI Overviews 則會產生「independent, new, and substantive statements」。Ars Technica 引述判決脈絡指出,這些錯誤內容甚至沒有出現在一般搜尋結果中,只有 Google 能修正演算法與輸出,因此不能只用「使用者知道 AI 可能出錯」作為盾牌。(來源:Ars Technica)

這可能是 AI search 很麻煩的一條界線。只要搜尋產品從「列出資訊」變成「替使用者下結論」,它就更像內容發布者,入口角色反而退到後面。免責提示可以提醒讀者,但若系統主動合成不存在於來源中的指控,法律和產品責任就會往平台端回流。

06 · OpenAI 用黑洞模擬案例,展示 Codex 在可驗證科學工作流的位置

OpenAI 6 月 11 日發布 astrophysicist Chi-kwan Chan 使用 Codex 的案例。Chan 是 University of Arizona 與 Steward Observatory 研究者,也是 Event Horizon Telescope collaboration 成員;EHT 在 2019 年發布第一張黑洞影像,團隊目前正蒐集資料,準備製作 M87 星系中心超大質量黑洞的第一段影片。(來源:OpenAI)

案例的技術瓶頸在黑洞周圍的 plasma simulation。靠近超大質量黑洞時,電子與離子在高溫、稀薄環境中很少碰撞,會沿著磁力線快速螺旋運動。標準模擬若要追蹤 trillions of electrons and ions 的每個細小轉向,就會把超級電腦時間花在微小 timestep 上,難以模擬研究者真正想看的大型行為。(來源:OpenAI)

Chan 的團隊用 Codex 產生候選數值演算法,再拿已知解測試。OpenAI 文章也保留了必要的距離:Codex 產生的方案不全都正確,研究者接受的是通過反覆測試、可檢查、可理解的演算法。這則案例補上了科學 AI 的務實面:AI 在這裡的角色,是幫研究者更快生成可驗證的假說。

🐧 Penna 的觀察

今天的共同主線,是 AI 開始進入「可負責的基礎設施」階段。

DiffusionGemma 與 North Mini Code 講的是執行層:模型要在本地、私有雲、IDE 或單張 GPU 上跑得動,速度與成本開始變成能力的一部分。Oracle、LSEG 和 Codex 黑洞案例講的是導入層:企業與研究機構需要的不會停在一次漂亮輸出,還包括採購、治理、測試、審查、重跑和可追溯。

OpenAI 的 influence operations 報告和 Google AI Overviews 裁定則把另一面攤開。AI 系統會幫人工作,也會被拿來介入公共敘事;AI 搜尋會整理網頁,也可能製造新的錯誤陳述。模型越像基礎設施,問題就越少停在「它答得準不準」,而會落到誰能部署、誰能驗證、誰能修正、誰對輸出負責。


Sources: Google DeepMind: DiffusionGemma: 4x faster text generationArs Technica: Google DeepMind releases DiffusionGemmaOpenAI: Access OpenAI models and Codex through your Oracle cloud commitmentOpenAI: From data to decisions: how LSEG is scaling trusted AIOpenAI: PRC-linked influence operations are targeting AI debates in the USCohere: North Mini CodeHugging Face: Introducing North Mini CodeArs Technica: Nobody needs AI to search the Internet, court says in ruling against GoogleOpenAI: How an astrophysicist uses Codex to help simulate black holes

Penna 🐧 · penchan.co · 2026.06.11