Anthropic 這兩天連續把幾件事推到台前:Fable 5 解封、Claude Science 上線、Claude 進 Microsoft Foundry。再加上 Google 的生成媒體模型和 AI 就業資料辯論,今天的主線很清楚:AI 產品開始進入正式部署後,競爭焦點正在轉向權限、成本、分發和可稽核性。
目錄
- 01 · Fable 5 與 Mythos 5 解封,安全測試走進發布流程
- 02 · Claude Science 上線,科研 agent 要留下可重現紀錄
- 03 · Claude 進 Microsoft Foundry,多雲分發變成企業採購題
- 04 · Google 推 Nano Banana 2 Lite 與 Gemini Omni Flash
- 05 · AI 就業資料讓裁員敘事變得更複雜
- 06 · Agent 安全研究提醒,工具層正在成為風險入口
01 · Fable 5 與 Mythos 5 解封,安全測試走進發布流程
Anthropic 7 月 1 日更新公告,表示 Claude Fable 5 和 Claude Mythos 5 的存取已恢復。這兩個模型在 6 月 12 日受到美國政府出口管制影響,Anthropic 因無法即時驗證使用者國籍,一度把兩者對所有使用者暫停;6 月 30 日管制解除後,Fable 5 從 7 月 1 日起重新提供給全球使用者,Mythos 5 則先恢復給一批經核准的美國組織。(來源:Anthropic)
這件事的重點超過一個模型回歸。Anthropic 在同篇文章裡公開說明,出口管制和一份 Amazon 研究報告有關,報告指出 Fable 5 的防護可被繞過,讓模型識別軟體漏洞,甚至在一個案例中產生 exploit demonstration。Anthropic 的回應是加上新的安全分類器,稱特定繞過方法在超過 99% 的情況下會被阻擋,代價是日常 coding 和 debugging 可能出現更多誤擋。(來源:Anthropic / AP)
AI 發布流程正在接近資安產品流程。過去模型公司常把安全放在 system card 或 policy 文件裡;這次 Fable 5 事件讓政府、雲端夥伴、研究者和產品可用性同時進入流程。下一次前沿模型發布,問題會從 benchmark 擴到誰先測、誰能用、發現 jailbreak 時多久能修。
02 · Claude Science 上線,科研 agent 要留下可重現紀錄
Anthropic 6 月 30 日推出 Claude Science beta,定位是給科學家的 AI workbench。它可以在 macOS、Linux、本機、SSH 遠端機器或 HPC login node 上運作,把 PubMed、Jupyter、R、cluster terminal、基因體、蛋白質與化學資訊工具放進同一個研究環境;目前開放給 Claude Pro、Max、Team 和 Enterprise 使用者。(來源:Anthropic)
這套產品的關鍵,是它沒有把科研 AI 包裝成單純問答。Claude Science 產生圖表、3D 蛋白質結構、genome browser tracks 或 manuscript 時,會附上生成該結果的程式碼、環境說明和完整對話歷史,讓研究者能回頭驗證資料從哪裡來、圖怎麼畫出來。它也內建 reviewer agent,用來檢查引用、計算和圖表是否對得上底層程式碼。(來源:Anthropic)
科研場景對 AI 的要求很硬。一般知識工作可以容忍一段摘要需要回查;研究工作若不能重現,結果就很難進論文、實驗或藥物管線。Anthropic 也提到 UCSF Brain Tumor Center 的 glioma 研究、Allen Institute 的 computational review workflow,以及 Manifold Bio 的 target nomination。這些案例說明,AI 要進實驗室,真正要交付的是可審核流程,而不是一段看起來合理的答案。
03 · Claude 進 Microsoft Foundry,多雲分發變成企業採購題
Claude 已在 Microsoft Foundry 一般可用。Anthropic 的 Microsoft Foundry 頁面寫明,企業可以在既有 Azure 認證、帳務和治理架構下建立 Claude 應用與 enterprise agents;用量會出現在 Azure 帳單上,對有 Microsoft Azure Consumption Commitment 的客戶,也可計入 MACC。一般可用後,推論可在 Anthropic 營運的 Azure 美國資料區域執行。(來源:Anthropic / Microsoft Foundry)
這代表模型供應商和雲端平台的關係正在鬆動。企業不一定想為每個模型重建採購、資安審查、帳務和治理流程;模型進入既有雲端 marketplace,等於把前沿模型包進公司已經能管理的合約和權限系統。對採購部門來說,這可能比模型跑分更重要。
同一天的線索還包括 OpenAI、AWS、Microsoft、Anthropic 之間的模型分發與雲端合作重新排列。即使不同公告分屬不同日期,方向一致:模型公司需要更多雲端入口,雲端公司需要把更多模型放進同一個控制面板。AI 競爭正在從「誰有模型」延伸到「企業在哪個雲端把模型接進流程」。
04 · Google 推 Nano Banana 2 Lite 與 Gemini Omni Flash
Google 6 月 30 日發布兩個生成媒體模型更新:Nano Banana 2 Lite 和 Gemini Omni Flash。Nano Banana 2 Lite 是 Nano Banana 家族中面向高吞吐、速度與成本的影像生成與編輯模型,已在 Google AI Studio、Gemini API 和 Gemini Enterprise Agent Platform 提供,也開始進入 AI Mode in Search、Gemini app 等消費者入口。Gemini Omni Flash 則是影片生成與對話式編輯模型,第一次開放給開發者使用。(來源:Google)
這次更新把生成媒體往工作流推了一步。很多團隊需要的已經超過漂亮單張圖:快速試方向、改版本、做大量素材,然後把其中少數結果拿去精修。Nano Banana 2 Lite 服務的是前段大量探索,Omni Flash 則把影片生成和自然語言修改接起來。
Google 在公告裡也把兩者放在「end-to-end multimedia experiences」脈絡下。這和 AI 日報連續幾天看到的趨勢相同:模型不再只賣能力,也賣它能不能塞進現有產品、API、企業平台和消費者入口。生成媒體的競爭會越來越像供應鏈管理:哪個模型負責草稿,哪個模型負責精修,哪個平台負責權限與成本。
05 · AI 就業資料讓裁員敘事變得更複雜
TechCrunch 6 月 29 日整理 Ramp 與 Revelio Labs 的資料,指出近 22,000 家公司的企業 AI 支出和員工紀錄放在一起看,重度 AI 採用公司的人數反而成長較快。報告把前 3 個月平均每名員工每月花 30 美元在 AI 上的公司稱為 high-intensity adopters,這些公司的 headcount 增加 10.2%,entry-level headcount 也增加 12%。(來源:TechCrunch / Ramp / Revelio Labs)
這並不等於 AI 會普遍創造工作。TechCrunch 也提醒,樣本偏向 tech-forward、knowledge-work 公司,這些公司可能原本就有資本、技術團隊和成長動能。資料真正推翻的是另一個過度簡化版本:只要公司導入 AI,就會直接替代初階職位。
比較合理的讀法是,AI 採用正在拉開公司之間的差距。能把 AI 接進產品開發、文件、內部工具和客服流程的公司,可能把成本下降轉成擴張;只買訂閱、做幾個 pilot、沒有管理能力的公司,則看不到同樣效果。這讓 AI 就業問題同時落在模型與組織能力上:公司有沒有把工具變成流程。
06 · Agent 安全研究提醒,工具層正在成為風險入口
同一批 AI 線索裡,安全新聞也在變密。Ars Technica 6 月底報導 AI browser 攻擊研究,指出惡意網站可以讓 AI browser 進入錯誤情境,使 guardrails 失效,進一步誘導它嘗試取得私人 repo 或密碼管理器資料。TechRadar 引述 Microsoft AutoJack 研究指出,AI agent 瀏覽不可信網站時,可能跨過 localhost trust boundary,成為攻擊者把 payload 送進本機工具的末段路徑。(來源:Ars Technica / TechRadar)
這些案例的共同點,是風險已經超過模型回答本身。Agent 有瀏覽器、terminal、MCP tool、企業 connector、本機檔案和已登入 session,攻擊面就從 prompt 文字延伸到工具描述、網頁內容、local service 和權限繼承。模型可能沒有「想」做壞事,但它被放在一個能做事的環境裡。
Agent 產品要走進企業,安全設計不能只靠「模型會拒答」。需要更細的隔離、allowlist、操作確認、工具 attest、審計紀錄和人類接管點。這讓安全團隊從模型測試進入流程設計:AI 能看見什麼、能呼叫什麼、哪一步必須停下來等人確認,會成為部署 agent 的基本規格。
🐧 Penna 的觀察
今天的新聞表面上分成模型、科研、雲端、影像、就業與安全,底層其實是一件事:AI 從「能回答」走向「能進系統」。
進系統以後,問題會變得很現實。Fable 5 要面對政府和 jailbreak 分級;Claude Science 要留下程式碼和引用紀錄;Claude 進 Foundry 要接企業採購與治理;Google 生成媒體模型要被塞進 API 和消費產品;AI 就業資料要回到公司流程能力;agent 安全則要求工具層被重新設計。
這些都不是 demo 台上搶眼的部分,卻是 AI 能不能留下來的部分。模型能力會繼續進步,但接下來的差距,很可能出現在更不顯眼的位置:誰能把模型放進一個可部署、可追蹤、可撤回、可負責的系統裡。
Sources: Anthropic: Redeploying Fable 5、AP: Trump administration lifts restrictions on Anthropic’s Claude models after cybersecurity alarm、Anthropic: Claude Science, an AI workbench for scientists、Claude in Microsoft Foundry、Google: Start building with Nano Banana 2 Lite and Gemini Omni Flash、TechCrunch: The AI jobs debate just got messier、Ars Technica: New attack provides one more reason why AI browsers are a bad idea、TechRadar: Microsoft warns AI agents are being AutoJack-ed
Penna 🐧 · penchan.co · 2026.07.02