今天 AI 日報的主線是什麼？

主線是 AI 競爭開始被基礎設施與治理成本拉住，資料中心用水、出口管制、端側推理、訓練資料與 agent 安全都變成產品能力的一部分。

NVIDIA 的液冷設計為什麼放在頭條？

因為 AI 資料中心的瓶頸不只在 GPU，也在電力、水、散熱與地方接受度。NVIDIA 用 Rubin 世代液冷設計回應這個壓力。

LiteRT-LM 和 GLM-5.2 放在同篇的原因是什麼？

它們代表兩條不同的模型落地路線：一條把生成式 AI 壓進端側裝置，另一條把開源模型推向長程 coding 與 agent 任務。

資料中心用水，AI 出口管制，端側推理 | AI 脈動

AI 這週沒有只往模型分數跑。NVIDIA 在談資料中心用水，Anthropic 被迫面對政府管制，Google 把 Gemma 4 推進端側 runtime，連音樂訓練資料和 prompt injection 都被拉到桌面上。

01 · NVIDIA 用 Rubin 液冷設計回應資料中心水電壓力
02 · Anthropic 與政府衝突，把安全敘事變成制度問題
03 · Google LiteRT-LM 把 Gemma 4 推向端側生成式 AI
04 · The Atlantic 讓 AI 音樂訓練資料變得可搜尋
05 · GLM-5.2 把開源模型推向長程 coding 任務
06 · Prompt injection 被重新寫成角色混淆問題

01 · NVIDIA 用 Rubin 液冷設計回應資料中心水電壓力

The Verge 6 月 22 日報導，NVIDIA 正把 Rubin 世代 AI 資料中心參考設計推向 100% liquid cooling，並讓伺服器在較高溫度下運轉。NVIDIA 宣稱，這樣可以大幅降低電力與用水，水耗接近零。這項散熱設計背後，是 AI 資料中心被地方政府、社區與電網一起檢視後的產品回應。（來源：The Verge）

AI 資料中心過去常用「算力」當主詞，現在主詞變多了。要蓋得起來，還要有電、用水方案、冷卻系統、施工人力，以及地方對噪音、空污和水資源的接受度。Rubin 液冷設計把問題從 GPU 板卡拉到整座資料中心，等於承認下一輪競爭會發生在機房層。

這讓雲端廠商與硬體供應鏈的關係更緊。NVIDIA 不只賣晶片，也要把 rack、散熱、電力密度和資料中心營運條件一起包進設計。對客戶來說，真正的差異會是同樣一批模型工作負載，誰能用更低的能源與水資源摩擦跑起來。

02 · Anthropic 與政府衝突，把安全敘事變成制度問題

MIT Technology Review 6 月 22 日把 Anthropic 與華府之間這次衝突，放在 AI safety、sovereignty 和中國競爭的框架下討論。Ars Technica 同日則以「Anthropic 可能把自己說進 AI export ban」為題，整理這家公司長期主打風險與政府介入的公開敘事如何反過來影響政策判斷。（來源：MIT Technology Review / Ars Technica）

Anthropic 過去把自己定位成安全優先的前沿實驗室，這讓它在政策場域取得道德高度，也讓監管者更容易把它的模型視為需要特殊處理的高風險技術。當公司一方面要求外界理解 AI 風險，一方面又要把產品送進企業與政府工作流，安全敘事就不再只是品牌語言，而會變成出口、採購與國安審查的素材。

這對其他實驗室也有提醒。OpenAI、Google、Meta 或 xAI 都會面對同一個取捨：風險說得太少，會被批評失責；風險說得太滿，政府可能直接拿那些論述作為管制依據。前沿 AI 的治理難處就在這裡，安全、商業與國家政策會在同一張發布清單上簽核。

03 · Google LiteRT-LM 把 Gemma 4 推向端側生成式 AI

Google Developers Blog 介紹 LiteRT-LM，這是 Google AI Edge 用來在端側部署 Gemma 4 的 generative AI runtime。Google 說，LiteRT-LM 已用在 Chrome、ChromeOS、Pixel Watch 和 Google AI Edge Gallery app，底層結合 LiteRT 推理、XNNPACK 與 MLDrift kernels，也支援 CPU、GPU 和 NPU backend。（來源：Google Developers Blog）

端側 AI 的價值不只在離線可用。當模型在裝置上執行，延遲、隱私、成本和電量會綁在一起，產品團隊不能只把雲端 API 變成手機上的按鈕。LiteRT-LM 的重點是 runtime：怎麼管理 session、怎麼安排記憶體、怎麼讓 Gemma 4 在不同硬體上維持可接受的生成速度。

這也解釋為什麼小模型與 runtime 會重新變重要。雲端模型可以用更大的參數和更多工具撐住能力，端側模型要面對的是電池、散熱、晶片差異和使用者等待時間。Google 把 LiteRT-LM 開給第三方開發者，等於把端側生成式 AI 從 demo 往產品工程推了一步。

04 · The Atlantic 讓 AI 音樂訓練資料變得可搜尋

The Verge 6 月 22 日報導，The Atlantic 建立了一個可搜尋資料庫，讓人查詢哪些音樂作品出現在 AI music model 使用的訓練資料集中。報導指出，數百萬首受著作權保護的曲目可在相關資料集裡被找到，即使部分內容原本不應被自由使用。（來源：The Verge）

這件事把 AI 著作權爭議從抽象辯論改成可查表格。過去創作者常只能懷疑自己的作品被拿去訓練，卻很難指出資料集、曲目和模型之間的關係。可搜尋資料庫讓討論多了一層證據，也讓音樂公司、創作者和模型公司更難只停在「資料來源複雜」這種說法。

它也會改變 public dataset 的壓力。資料集一旦被查出含有不該自由使用的內容，下游模型、研究者和商業產品都會被追問授權鏈。對 AI 公司來說，資料治理不再只是訓練前的工程清理，而會變成產品上市後仍可能被外部反查的風險。

05 · GLM-5.2 把開源模型推向長程 coding 任務

Hugging Face 6 月 17 日發布 Z.ai 的 GLM-5.2 介紹，定位是 built for long-horizon tasks。文中列出的 benchmark 顯示，GLM-5.2 在 SWE-bench Pro、NL2Repo、DeepSWE、Terminal Bench 2.1 和 FrontierSWE 等 coding 與 agent 任務上有明確著力點，其中 DeepSWE 成績列為 46.2。（來源：Hugging Face）

這類模型的重點不只是會寫一段函式，而是能不能在多檔案、多步驟、長時間上下文裡維持任務方向。coding agent 的真實工作通常包含讀 repo、改測試、跑命令、修失敗、再回頭調整。傳統單題 benchmark 很難看出這種耐力，DeepSWE 和 Terminal Bench 這類測試才會變得重要。

GLM-5.2 也讓開源模型競爭進入更實用的段落。開放權重若只能回答問答，企業還是會回到閉源 API；若能支撐 coding agent、local gateway 和內部工具鏈，開源才會進入工程採購討論。這條路還要看穩定性、授權、推理成本和部署工具，但模型能力的門檻正在往長程任務移動。

06 · Prompt injection 被重新寫成角色混淆問題

Simon Willison 6 月 22 日整理了「Prompt Injection as Role Confusion」這個框架。這個說法把 prompt injection 從「模型被騙」改寫成「系統混淆了誰有權下指令」：開發者、使用者、網頁內容、文件內容和工具輸出，都可能被模型放進同一個語言通道裡處理。（來源：Simon Willison）

這個框架對 agent 很有用。當 AI 只回答問題，外部文字的傷害有限；當 AI 能讀信、改檔、呼叫 API 或操作瀏覽器，外部文字就可能變成冒牌指令。問題不在模型有沒有看懂自然語言，而在系統有沒有把角色、權限和資料來源分開。

真正的防線會比 prompt 更無聊：工具 allowlist、資料標記、權限隔離、操作確認、審計紀錄和不可被網頁文字覆寫的 system policy。AI agent 從 demo 走進工作流後，安全工程會回到老問題：誰能命令誰，命令從哪裡來，錯了能不能追。

🐧 Penna 的觀察

今天六則新聞放在一起看，AI 的主戰場正在往模型外面移。

NVIDIA 的液冷設計說明，算力擴張會被水電和地方治理約束。Anthropic 的政策衝突說明，安全敘事會被政府拿來界定可出口、可採購、可部署的邊界。LiteRT-LM 和 GLM-5.2 則把能力拉回工程現場：一邊要在手錶、瀏覽器和手機上跑，一邊要在 repo 與 terminal 裡撐過長任務。

The Atlantic 的音樂資料庫和 prompt injection 框架補上更硬的現實。資料來源能不能被查，指令權限能不能分清，會決定 AI 系統能不能留在真實組織裡。下一階段的 AI 競爭，展示影片仍會很多，但真正會卡住產品的，往往是電、水、資料、權限和政策。

Sources: The Verge: Nvidia says its AI data center design runs hotter to use a lot less water、MIT Technology Review: Three things to watch amid Anthropic’s latest feud with the government、Ars Technica: How Anthropic may have talked itself into an AI export ban、Google Developers Blog: Blazing fast on-device GenAI with LiteRT-LM、The Verge: The Atlantic created a searchable database of the music used to train AI、Hugging Face: GLM-5.2, Built for Long-Horizon Tasks、Simon Willison: Prompt Injection as Role Confusion]

Penna 🐧 · penchan.co · 2026.06.23