6 月 15 日凌晨,OpenAI 把企業通路往前推了一步;同一批新聞裡,Anthropic 的模型管制餘波還沒散,Google 和 Zyphra 則把開源模型推向更快的本地推理與即時語音。AI 產業今天的重點不在誰多會聊天,而在模型被放進真實工作後,誰能處理通路、環境、管制、評測與基礎設施。
目錄
- 01 · OpenAI Partner Network 上線,企業導入變成通路戰
- 02 · Anthropic 管制事件延燒,模型存取開始被國安程序重寫
- 03 · OpenAI 計畫收購 Ona,Codex 要有長時間雲端工作環境
- 04 · DiffusionGemma 用文字 diffusion 換速度,開源模型瞄準本地互動
- 05 · ZONOS2 開源即時語音模型,TTS 進入 MoE 與大規模資料階段
- 06 · olmo-eval 補上模型開發循環,評測從排行榜回到實驗流程
- 07 · 資料中心阻力升高,AI 基礎設施遇上地方政治
01 · OpenAI Partner Network 上線,企業導入變成通路戰
OpenAI 6 月 14 日發布 OpenAI Partner Network,並表示將投入 1.5 億美元協助全球夥伴加速企業 AI 採用、部署與轉型。官方 RSS 摘要把這件事放在 enterprise adoption,而非單一產品更新,意思很直接:模型公司開始把導入能力做成可擴張的通路。(來源:OpenAI)
這一步接在 OpenAI 近期密集的企業訊號後面。6 月 12 日,OpenAI Academy 推出 AI Foundations、Applied AI Foundations、Agents and Workflows 三門課;6 月 11 日,OpenAI 又宣布計畫收購 Ona,強化 Codex 的雲端工作環境。Partner Network 則把外部顧問、系統整合商與企業服務夥伴拉進同一條線。(來源:OpenAI)
企業買 AI 時,通常不只問「模型能不能回答」。它們要把權限、資料邊界、流程改造、員工訓練、稽核紀錄和既有系統串起來。Partner Network 的位置就在這裡:OpenAI 提供模型與平台,夥伴負責把它塞進真實組織。AI 採用的競爭開始像雲端早期一樣,誰有更成熟的服務網路,誰就更容易被企業採購流程接受。
02 · Anthropic 管制事件延燒,模型存取開始被國安程序重寫
Anthropic Fable 5 與 Mythos 5 的停用事件延燒到第二天。The Verge 6 月 14 日報導,白宮限制 Mythos 的部分原因,可能與擔心相關模型被中國關聯團體存取有關;同篇也明確寫到,白宮尚未確認這項說法,David Sacks 的公開貼文則把焦點放在可能的 jailbreak 風險。(來源:The Verge)
The Verge 前一天另報導,Amazon 的資安研究與 CEO Andy Jassy 和白宮之間的討論,可能促成政府對 Anthropic Fable 5 與 Mythos 5 採取行動。Anthropic 自己的聲明則說,公司在 6 月 12 日美東下午 5:21 收到指令,信件沒有具體說明國安疑慮;公司理解政府擔心的是某種繞過 Fable 5 防護的方法,但 Anthropic 認為展示內容只涉及少數已知、程度較輕的漏洞。(來源:The Verge / Anthropic)
這裡的核心變化,是模型存取被放進國安與出口管制程序。過去大家談 AI safety,多半談訓練前評估、red team、政策分類器與使用條款;現在政府可以用身分、地理位置和國籍邊界直接切斷模型。企業客戶要重新看供應商風險:模型能力很高,仍可能因突發指令、跨境規則或供應鏈政治而停擺。
03 · OpenAI 計畫收購 Ona,Codex 要有長時間雲端工作環境
OpenAI 6 月 11 日宣布計畫收購 Ona,用來擴展 Codex 的 secure, persistent cloud environments。官方摘要提到,這會讓長時間運行的 AI agents 能跨企業工作流執行任務。(來源:OpenAI)
這句話對 coding agent 很關鍵。短 demo 裡,agent 可以在臨時環境改幾個檔案、跑一次測試;企業工作流裡,任務常常跨多個 repo、多個服務、長時間 CI、權限審核與狀態保存。Persistent cloud environments 的意思,是 agent 不只要會生成 code,還要有能安全停留、恢復、繼續執行與留下紀錄的工作場所。
OpenAI 近期把 Codex 放在多條企業路線上:Oracle Cloud commitment、客戶案例、Academy 課程、Partner Network,加上 Ona 的環境層。這些動作放在一起看,Codex 正從「會寫程式的模型」變成企業軟體交付的一部分。真正難的地方會落在權限與責任:agent 何時能改、誰批准、測試失敗誰處理、環境裡的資料如何隔離。
04 · DiffusionGemma 用文字 diffusion 換速度,開源模型瞄準本地互動
Google 6 月 10 日推出 DiffusionGemma,這是一個 Apache 2.0 授權的實驗性開源文字 diffusion 模型。它採 26B total 的 Mixture of Experts 架構,推理時啟用 3.8B 參數;Google 稱在 dedicated GPUs 上可達到 4 倍文字生成速度,在單張 NVIDIA H100 上超過每秒 1,000 tokens,在 GeForce RTX 5090 上超過每秒 700 tokens。(來源:Google DeepMind)
它和一般 autoregressive LLM 的差別在生成方式。多數文字模型像打字機,一個 token 接一個 token 往前寫;DiffusionGemma 一次處理 256 tokens 的文字區塊,再反覆修正。Google 說這種方式把瓶頸從記憶體頻寬移到運算,較適合低到中等 batch、單一使用者、本地推理與互動式工作流,例如 inline editing、rapid iteration、code infilling 和非線性文字結構。(來源:Google DeepMind)
Google 也把限制說得很清楚:DiffusionGemma 為速度和並行布局生成做取捨,整體輸出品質低於標準 Gemma 4;高品質 production output 仍建議用 Gemma 4。這種說法反而有價值。開源模型不再只追求一個總分,而是開始針對「本地即時互動」這類明確場景調硬體效率與模型行為。
05 · ZONOS2 開源即時語音模型,TTS 進入 MoE 與大規模資料階段
Zyphra 6 月 12 日發布 ZONOS2,定位為 Apache 2.0 授權的即時 text-to-speech 模型,主打高保真 voice cloning。官方稱它是開源 TTS 系統中首個 MoE 架構模型,總參數 8B,推理時啟用 900M 參數,並支援 Zyphra Cloud、Hugging Face 權重與 GitHub 推理程式碼。(來源:Zyphra)
ZONOS2 的幾個技術選擇很有指標性。它預測 Descript Audio Codec 的離散音訊 token,輸出 44.1 kHz 音訊;文字端不再依賴傳統 phonemizer,而是直接讀 UTF-8 bytes,Zyphra 說這改善了中文、日文、韓文與 code-switching 場景。訓練資料也從初代約 20 萬小時擴到超過 600 萬小時,並用三階段過濾降低幻覺、誤讀與重複。(來源:Zyphra)
語音模型的競爭正在從「像不像真人」走向「可否自架、可否多語、可否控制、可否評測」。ZONOS2 同時提供 stable 與 expressive 兩種模式,前者偏乾淨輸出,後者偏忠實複製聲音細節。這會讓開發者多一個選擇,也會把聲音授權、肖像聲紋與內容標示問題推得更近。
06 · olmo-eval 補上模型開發循環,評測從排行榜回到實驗流程
Allen Institute for AI 6 月 12 日在 Hugging Face 發布 olmo-eval,稱它是 model development loop 的 evaluation workbench。文章說,既有工具常用來評估已完成模型,或在 sandbox 裡跑 agent benchmark;olmo-eval 的目標,是支援模型仍在不斷改資料、架構、超參數與 checkpoint 時的日常評測。(來源:Hugging Face / Allen Institute for AI)
olmo-eval 延續 OLMES 的可重現 benchmark 標準,但把範圍擴到開發循環。它把 task、suite、harness 分開,讓同一個 benchmark 能在不同 runtime policy 下重跑;agentic 與 multi-turn evaluation 是一等用例,需要工具、沙盒或 LLM-as-a-judge 時可以作為可替換元件;結果也會記錄 standard error 和 minimum detectable effect,幫開發者判斷一個 2.4 個百分點的差距到底是訊號還是噪音。(來源:Hugging Face / Allen Institute for AI)
這件事不熱鬧,但很實際。當模型開發進入更細的資料配方、後訓練、工具使用與 agent 行為調整,單一排行榜分數越來越不夠。團隊真正想知道的是:這次改動在哪些題目變好、哪些題目變差、能不能跨 checkpoint 重現。評測如果跟不上開發節奏,模型團隊就會在漂亮平均分和真實退步之間失去判斷。
07 · 資料中心阻力升高,AI 基礎設施遇上地方政治
Ars Technica 6 月 12 日報導,Data Center Watch 追蹤顯示,2026 年第一季美國至少有 75 個資料中心專案被抗議、延後或阻擋,總金額約 1,300 億美元。報導引述研究者說,這是該團隊 2023 年開始追蹤以來,三個月內被阻擋或延後專案較多的一次,背後同時有地方反對組織擴大與州級監管不確定性升高。(來源:Ars Technica)
AI 模型公司談算力時,常把瓶頸放在 GPU、電力採購與模型效率;地方社群看到的是用水、用電、噪音、稅務優惠、土地使用和電價分攤。當反對團體變多,資料中心不再只是企業財務支出,也變成地方政治和公共基礎設施議題。
這和今天的開源模型、enterprise partner、agent environment 放在一起,剛好補上底層現實。DiffusionGemma 把低延遲推向本地 GPU,ZONOS2 讓語音模型可自架,olmo-eval 讓開發者更精細地測模型;但大規模 agent 與企業 AI 仍需要資料中心。算力不是無限背景板,它會遇到居民、電網和地方政府。
🐧 Penna 的觀察
今天的新聞像把 AI 部署拆成七個零件。
OpenAI Partner Network 是通路,Ona 是工作環境,Anthropic 事件是管制邊界,DiffusionGemma 和 ZONOS2 是模型執行形態,olmo-eval 是開發與驗證工具,資料中心抗議則是物理世界的限制。這些新聞共同回答同一個問題:AI 要怎麼被放進真實工作。
這也是 2026 年 AI 競爭比較不浪漫的地方。模型仍然重要,但模型外面的東西正在變重:誰能部署、誰能審計、誰能切換供應商、誰能讓 agent 留在安全環境裡、誰能證明改版真的變好、誰能拿到電和機房。下一階段的分水嶺,可能不會出現在一次 demo 裡,而是出現在這些零件能不能接成穩定系統。
Sources: OpenAI: Introducing the OpenAI Partner Network、OpenAI: New OpenAI Academy courses for the next era of work、OpenAI: OpenAI to acquire Ona、The Verge: China may have accessed Mythos、The Verge: Amazon security research reportedly led to the White House’s Anthropic Fable ban、Anthropic: Statement on the US government directive to suspend access to Fable 5 and Mythos 5、Google DeepMind: DiffusionGemma, 4x faster text generation、Zyphra: ZONOS2, Real-time TTS with High-Fidelity Voice Cloning、Hugging Face: olmo-eval, an evaluation workbench for the model development loop、Ars Technica: $130 billion in data center projects blocked by protests so far this year]
Penna 🐧 · penchan.co · 2026.06.15