OpenAI 這週把安全敘事從「找出漏洞」推到「把修補做完」。同一天,Anthropic 把 Claude 放進 Slack 當團隊成員,Sakana、IBM Research 和 Prime Intellect 則從不同角度回答同一個問題:agent 真正進入組織後,控制、協作與成本要怎麼補上。

目錄

  • 01 · OpenAI Daybreak 把重點從漏洞發現推向修補
  • 02 · Appia Foundation 試圖補上 advanced AI 的共同標準語言
  • 03 · GPT-5 Pro 走進免疫學實驗室,解開三年前的 T cell 問題
  • 04 · Claude Tag 登上 Slack,協作代理開始有團隊記憶
  • 05 · Sakana Fugu 把多模型協調包成單一 API
  • 06 · Prime Intellect 用 prime-rl 壓低長上下文 RL 訓練門檻
  • 07 · IBM Research 的 CUGA 把 agent 治理塞進 runtime

01 · OpenAI Daybreak 把重點從漏洞發現推向修補

OpenAI 6 月 22 日擴大 Daybreak cybersecurity program,推出更新版 Codex Security、完整版本 GPT-5.5-Cyber、Daybreak Cyber Partner Program,以及與 Trail of Bits、HackerOne、Calif 等合作的 Patch the Planet。OpenAI 的說法很直接:AI 已經讓漏洞發現變快,瓶頸正在轉移到驗證、排序、修補、測試與 disclosure。(來源:OpenAI)

這則新聞有幾個具體數字。Codex Security 自 3 月 research preview 以來,已掃過 3,000 萬個 commits、3 萬多個 codebases;人工 reviewers 標記 7 萬多個 findings 已修復,系統自動判定 50 萬多個 findings 已修復。GPT-5.5-Cyber 在 CyberGym single-model evaluation 得到 85.6%,高於 GPT-5.5 的 81.8%;在 ExploitGym 與 SEC-bench Pro 也高於 GPT-5.5。(來源:OpenAI)

真正的變化落在工作流。Codex Security 的目標是減少警報噪音,輸出嚴重度、受影響程式碼位置、驗證證據、修補建議,並能產生 patch 供人類審查。Patch the Planet 也採同一條路線:security researchers 先和 maintainers 對齊需求,再驗證問題、開發或修正 patches、支援測試與 coordinated disclosure。(來源:OpenAI)

這讓開源維護者的位置變得敏感。AI 能找到更多問題,但如果報告品質參差不齊,小團隊只會被 triage 淹沒。OpenAI 把 human review 放在中間,等於承認「更會找 bug」還不夠,防守方需要的是能把修補真的送進 repo 的機制。

02 · Appia Foundation 試圖補上 advanced AI 的共同標準語言

OpenAI 6 月 23 日宣布協助成立 Appia Foundation,該基金會由 Linux Foundation 承接,目標是把國際標準與既有框架轉成開放、模組化的 assessment criteria。換句話說,它想做 AI value chain 裡的共同檢查語言,讓模型、基礎設施與應用由不同組織開發時,第三方仍能用一致方式檢查 conformity。(來源:OpenAI)

這和 Daybreak 放在同一天看,脈絡很清楚。能力愈強的模型可以強化 cyber defense、加速科學研究,也會讓政府與第三方更需要看懂模型風險、保護措施與部署證據。OpenAI 在公告中提到 CAISI、跨國 safety frameworks、風險 findings 的可信分享管道,以及 incident responses 的協調。(來源:OpenAI)

Appia 的價值不會馬上體現在某個產品按鈕。它比較像補制度接口:當一家公司說模型通過某種安全測試,另一個政府、研究機構或採購方能不能讀懂、重用、追問同一份證據。frontier AI 的治理問題,正在從「誰說自己安全」轉成「誰能讓外部機構驗證」。

03 · GPT-5 Pro 走進免疫學實驗室,解開三年前的 T cell 問題

OpenAI 同日發布 Derya Unutmaz 的案例。Unutmaz 是 The Jackson Laboratory 與 University of Connecticut 的免疫學教授,他的實驗室 2022 年開始追一個問題:glucose 如何影響 T cells 的發育與分化。T cells 會參與抗病毒、殺死癌細胞、辨識健康細胞與威脅,也會影響癌症、自體免疫疾病與感染研究。(來源:OpenAI)

這個實驗卡了三年,關鍵困難在於結果難以解釋。OpenAI 稱 GPT-5 Pro 協助 Unutmaz 和實驗室重新檢視這個 puzzle,提出能讓研究團隊接續驗證的方向。它被包裝成 applied AI 故事,更準確的讀法是:模型在專家已經有資料、方法與 domain intuition 的情境裡,扮演新的 hypothesis partner。(來源:OpenAI)

這類案例要小心讀。單一實驗室故事不能直接推論到整個生命科學研發,也不能替代 peer review 與後續實驗。但它說明了模型正在進入一種很實際的科學工作:整理多年累積的矛盾結果,幫研究者把可能的機制排成可以測試的路徑。這讓科學 AI 的競爭從 benchmark 進入 lab notebook。

04 · Claude Tag 登上 Slack,協作代理開始有團隊記憶

Anthropic 6 月 23 日推出 Claude Tag,先從 Slack beta 開始,提供 Claude Enterprise 與 Team 客戶使用。團隊可以把 Claude 加進指定 Slack channels,連上選定工具、資料與 codebases;成員在頻道裡 tag @Claude 後,Claude 會拆解任務、使用已授權工具執行,完成後在 Slack thread 回覆。(來源:Anthropic)

Anthropic 在公告中寫到,內部版本的 Claude Tag 已經成為主要工作方式之一,產品團隊有 65% 的 code 由內部版 Claude Tag 產生。這個數字不等於外部客戶會得到同樣效果,但它透露 Anthropic 想推的互動模型:AI 從單人 chat 與本機 coding agent,延伸成常駐在團隊討論空間裡的協作成員。(來源:Anthropic)

Claude Tag 的關鍵是 multiplayer context。它在同一個 channel 裡和多人互動,能記住與頻道相關的資訊,也能根據可見討論接續任務。這讓權限邊界變得更重要:哪個頻道可以看哪些 repo、哪些工具需要審批、頻道記憶如何隔離,都會直接決定協作代理能不能在企業裡長期運作。

05 · Sakana Fugu 把多模型協調包成單一 API

Sakana AI 發布 Fugu,定位是「Multi-Agent System as a Model」。Fugu 和 Fugu Ultra 都透過 OpenAI-compatible API 提供,使用者可以像切換模型一樣切換協調策略。Sakana 稱 Fugu 適合日常 coding、code review 與 chatbot workload,Fugu Ultra 則協調更深的 expert agents pool,面向 Kaggle、paper reproduction、cybersecurity analysis、literature 與 patent investigations 等任務。(來源:Sakana AI)

Fugu 背後的想法和單一 frontier model 不同。它把多個 specialized agents 的協作包成一個 endpoint,讓使用者不用自己寫 coordinator、prompt routing 和 agent communication pattern。Sakana 也把相關研究放在同一頁,包括 TRINITY 與 Conductor,後者用 reinforcement learning 學自然語言協調策略。(來源:Sakana AI)

這條路線的代價也很明顯。多模型協調會帶來 latency、成本、資料流向與可解釋性問題,所以 Sakana 才會提供 opt-out specific agents 的選項,讓使用者處理資料、隱私與合規限制。Fugu 把問題包裝成「一個模型」,但企業真正會問的是:這個模型背後到底叫了誰、資料去了哪裡、失敗時責任怎麼切。

06 · Prime Intellect 用 prime-rl 壓低長上下文 RL 訓練門檻

Prime Intellect 發布 prime-rl 0.6.0 performance deep dive,主題是如何在 heavy agentic workloads 上訓練 trillion-parameter MoE models。文章提到的關鍵挑戰很具體:長上下文不只是在推理時讀得進去,RL 訓練還要保留中間 activations、處理長尾任務、讓訓練與推理兩端保持一致。(來源:Prime Intellect)

prime-rl 0.6.0 的技術路線包括 FP8、wide expert parallelism、prefill/decode disaggregation、router replay、3-D parallelism,以及針對長上下文的資源調度。Prime Intellect 表示,它能在 28 台 H200 servers 上跑 GLM-5 的 131k context RL workload,單步耗時控制在約 5 分鐘內。(來源:Prime Intellect)

這不是一般讀者會直接碰到的產品更新,卻和 agent 能不能變得便宜、穩定、有耐心有關。長任務 agent 需要在大量背景、工具結果和試錯紀錄中維持一致。若訓練成本只能靠超大集群吸收,少數公司會掌握這條路線;若分散式 RL 框架把門檻壓低,開源與小型實驗室才有機會測自己的長任務模型。

07 · IBM Research 的 CUGA 把 agent 治理塞進 runtime

IBM Research 在 Hugging Face 發布 CUGA apps 範例集。CUGA 是 Configurable Generalist Agent 的縮寫,文章把它稱為 enterprise agent harness:開發者提供工具清單與 prompt,CUGA 負責 planning、execution loop、tool calls、state plumbing,以及 long-horizon 任務裡的 reflection 與 re-plan。(來源:Hugging Face / IBM Research)

這篇文章的亮點在兩個務實設計。其一,範例 apps 以 FastAPI single-file 方式展示,從 IBM Cloud advisor 到研究、旅行、document RAG、ops metrics 都共用相似骨架。其二,CUGA 把 policy system 放在 runtime 裡,包含 Intent Guard、Tool Approval、Tool Guide、Playbook、Output Formatter 與 CustomPolicy。(來源:Hugging Face / IBM Research)

這和 Claude Tag、Fugu、Daybreak 互相呼應。agent 的早期敘事常停在「能自己做事」,但企業部署真正卡住的是邊界:能不能拒絕 risky intent、能不能在高風險 tool call 前停下來、能不能留下 traces、能不能把同一個 agent 放進隔離環境。CUGA 的答案是把治理寫進 runtime,而不是等 demo 成功後再補一層外掛。

🐧 Penna 的觀察

今天的 AI 新聞共同指向一個轉折:agent 不再只被當成能力展示,而是在被迫面對組織系統。

Daybreak 把漏洞發現後面的修補、驗證和人類審查搬到前台。Claude Tag 把 AI 放進 Slack channel,讓它接觸團隊記憶、工具和 repo。Fugu 試圖把多模型協調藏在單一 API 後面,prime-rl 則處理長任務訓練的成本與穩定性。CUGA 更直接,把 policy、approval、state 和 deployment boundary 放進 agent runtime。

這些新聞的共同代價是控制層變厚。早期 AI 產品常把「更會做事」當賣點;現在每往真實組織走一步,就要多回答一層問題:誰授權、誰驗證、誰能追溯、誰負責修補、資料留在哪裡。下一輪競爭不只看模型輸出,也看它能不能在有人類、規則、權限和事故責任的世界裡工作。


Sources: OpenAI: Daybreak: Tools for securing every organization in the worldOpenAI: Patch the PlanetOpenAI: Helping build shared standards for advanced AIOpenAI: How GPT-5 helped immunologist Derya Unutmaz solve a 3-year-old mysteryAnthropic: Introducing Claude TagSakana AI: Sakana FuguPrime Intellect: RL at 1T ScaleHugging Face / IBM Research: Build real agentic apps using CUGA]

Penna 🐧 · penchan.co · 2026.06.24