2026-05-09 AI 早報：多模態 Agent、Web Agent 訓練與基建投資

夕桜白雪

站點建設中

第一階段先固定內容結構、分類與部署流程；線上後台暫不加入，保持純靜態與 Git 可追蹤。

查看規劃

標籤

夕桜白雪

站點建設中

第一階段先固定內容結構、分類與部署流程；線上後台暫不加入，保持純靜態與 Git 可追蹤。

查看規劃

標籤

夕桜白雪

站點建設中

第一階段先固定內容結構、分類與部署流程；線上後台暫不加入，保持純靜態與 Git 可追蹤。

查看規劃

標籤

4112 字

12 分鐘

2026-05-09 AI 早報：多模態 Agent、Web Agent 訓練與基建投資

2026-05-09

AI News

/

多模態

/

Agent

/

AI 基建

/

融資傳聞

以下按 2026-05-09 AI 早報 原始時間軸整理。這天重點非常集中：新模型與多模態 Agent、Web Agent 訓練、AI Agent 規範政策、AI 基建投資、DeepSeek / 月之暗面 / 階躍星辰融資傳聞。GitHub 原文也把條目分成模型發布、開發生態、產品應用、技術與洞察、行業動態、前瞻與傳聞；但其中有不少來自 X、微信、媒體爆料與二手轉述，需要分級處理。(GitHub)

一、時間軸順序：原始事件 + 分級核對#

時間	原始事件	分級	核對與判斷
00<09>	螞蟻百靈發佈 Ring-2.6-1T，OpenRouter 免費試用一周	可作主新聞	OpenRouter 已有 `inclusionai/ring-2.6-1t` 頁面，標示 1T 級 thinking model、63B active parameters，面向 coding agent、tool use、long-horizon task execution；但「百靈官方 X」仍屬社媒來源，建議寫成「OpenRouter 已上線，官方社媒同步宣傳」。(OpenRouter)
00<29>	智譜發佈 GLM-5V-Turbo 報告，開放 Coding Plan 使用者申請使用	可留但降級	GitHub 日報引用飛書表單與微信文章，稱 GLM-5V-Turbo 面向多模態 Agent、GUI Agent、Coding Plan 用戶申請；但缺少穩定公開模型頁，建議降級。(GitHub)
00<38>	商湯科技推出 SenseNova 6.7 Flash-Lite	可作主新聞	SenseNova6.7 GitHub 倉庫明確描述 Flash-Lite 是面向真實工作流的輕量多模態 Agent 模型，強調原生多模態、辦公任務、token efficiency，並列出 API 與 Token Plan。(GitHub)
00<53>	階躍星辰發佈 StepAudio 2.5 Realtime 實時語音大模型	可作主新聞	GitHub 日報引用 StepAudio 官方頁與平台文檔，稱其支援中英文即時語音、WebSocket `/v1/realtime`、副語言感知與人設自定義；可作語音模型主新聞。(GitHub)
01<08>	AI2 發佈 EMO 模型，實現混合專家語義模組化	可作主新聞	AllenAI / GitHub / arXiv 均可核到 EMO：14B total、1B active MoE，訓練時利用文檔邊界讓 experts 形成語義模組，且可保留 12.5% experts 仍維持接近完整表現。(GitHub)
01<23>	千問團隊開源 WebWorld 世界模型，面向 Web Agent 訓練	可作主新聞	QwenLM/WebWorld GitHub 與 Hugging Face 頁面可核到，WebWorld 是用於 Web Agent 訓練與評估的大規模 web world model，基於 100 萬+真實網頁交互軌跡，支援 30+ 步長程模擬與多格式狀態表示。(GitHub)
01<38>	OpenClaw 發佈 2026.5.7 版，強化許可權與更新流程	可留但降級	GitHub release 頁存在，但日報重點主要來自 OpenClaw X；可寫成「OpenClaw 2026.5.7 更新權限與更新流程」，不宜壓過模型 / 官方大公告。(GitHub)
01<48>	AWS 發佈 Agent Toolkit for AWS 工具集	可作主新聞	AWS 官方頁與文檔確認 Agent Toolkit for AWS 可讓 Claude Code、Cursor、Codex 等 coding agents 透過安全、可審計介面操作 AWS，並提供 MCP Server、skills、plugins。(Amazon Web Services, Inc.)
01<59>	Kiro 首次付費獎勵 20 美元等值積分	可留但降級	Kiro FAQ 明確寫到首次升級付費方案可獲 20 美元 credit；這是產品促銷 / 計費更新，不是主新聞。(Kiro)
02<10>	Grok 聯結器功能正式上線安卓、iOS 及網頁端	可留但降級	目前能核到的多為 X / 社群 / 第三方轉述，稱 Grok Connectors 已支援 GitHub、Notion、Google Workspace 等；未見 xAI 官方長文，應標「社群 / X 訊息」。(X (formerly Twitter))
02<37>	Google Health Coach 結束預覽，面向全球上線	可作主新聞	Google 官方博客稱 Health Coach 將退出 preview，作為 Google Health Premium 的一部分面向全球推出；可作產品應用主新聞，但涉及健康場景，正式稿要避免寫成醫療診斷工具。(blog.google)
02<48>	Anthropic 發文闡述消除 Claude 的 agentic misalignment 行為	可作主新聞	Anthropic 官方《Teaching Claude why》稱，自 Claude Haiku 4.5 以來，Claude 系列在 agentic misalignment eval 上達到 perfect score，並解釋如何降低黑mail / misaligned 行為。(anthropic.com)
03<04>	MiniMax 修復 M2 模型稀疏 Token 遺忘及小語種混雜問題	可留但降級	主要來源是微信 / 日報轉述，公開可核來源不足；可保留為「MiniMax 官方微信稱修復 M2 問題」，不宜寫硬。(GitHub)
03<25>	Google DeepMind 發佈 AI Co-Mathematician	可作主新聞	arXiv 論文《Accelerating Mathematicians with Agentic AI》明確介紹 AI co-mathematician，是基於 Gemini 的數學研究 agent workbench，用於 ideation、文獻搜尋、計算探索、定理證明與理論構建。(arXiv)
03<44>	阿里巴巴提出 CDM 框架，四步推理實現影象生成最優	可留但降級	目前我沒有核到強官方來源；可放「技術研究觀察」，但正式稿建議標「論文 / 項目頁」並等待 arXiv、GitHub 或阿里官方頁補強。
03<58>	Claude Code 團隊成員發文主張 HTML 替代 Markdown 作為 Agent 輸出格式	可留但降級	來源為 X / 個人觀點，適合放「開發者觀點」，不宜寫成 Anthropic 官方產品方向。(GitHub)
04<09>	Nathan Lambert 發文總結其中國 AI 實驗室之行	可留但降級	Interconnects.ai 屬個人深度觀察，可作評論材料，但不是新聞官宣。(GitHub)
04<25>	DeepSeek 網頁與 API 服務發生短時間大規模中斷	可作主新聞，但需標明影響範圍有限	DeepSeek status 頁顯示目前已恢復，API / Web Chat 仍可看到歷史 uptime；「大規模」需依狀態頁與社群回報交叉，不宜誇大。(status.deepseek.com)
04<43>	Anthropic 一季度營收增 80 倍，Mythos 能力遭質疑	可留但降級	「80 倍」主要來自媒體 / 訪談轉述，非公開財報；Mythos 能力與網安風險後續有多家媒體追蹤，但兩件事最好拆開寫，不要合成一條硬結論。(Venturebeat)
05<03>	Cloudflare 裁減 1100 人，適應 AI Agent 時代重構組織	可作主新聞	Cloudflare 官方博客明確稱將裁減超過 1100 人，並把組織調整與 agentic AI-first operating model、內部 AI 使用激增放在同一敘事中。(Reuters)
05<17>	NVIDIA 與 IREN 合作，將部署 5GW AI 基礎設施，涉 21 億美元投資	可作主新聞	Reuters 報導稱 NVIDIA 將投資最高 21 億美元於 IREN，作為部署最高 5GW AI infrastructure 的更大交易一部分；這是 AI 基建與電力容量主線。(Reuters)
05<33>	三部門印發智慧體規範意見，明確 19 個典型應用場景	可作主新聞	新華社 / 北京日報報導，國家網信辦、發改委、工信部聯合印發《智能體規範應用與創新發展實施意見》，提出安全可控、規範有序、創新驅動、應用牽引，並列出 19 類典型應用場景。(news.cn)
05<45>	DeepSeek 傳籌備 500 億融資，6 月發佈 V4.1 模型	前瞻與傳聞	來源指向 The Information / 36Kr 等二手報導；融資額與 V4.1 發布時間均未見 DeepSeek 官方確認，應嚴格標「傳聞」。(eu.36kr.com)
06<04>	階躍星辰傳完成 25 億美元融資，加速籌備赴港上市	前瞻與傳聞，但可信度較高	財新、澎湃、證券時報、KR-Asia 等均報導階躍星辰將完成近 25 億美元融資並拆紅籌、推進港股 IPO；但公司未正式公告，仍應寫「據報」。(caixin.com)

二、欄目化重排版#

要聞#

螞蟻百靈 Ring-2.6-1T 上線 OpenRouter，主打 1T 級 thinking model、63B active parameters、Agent 工作流與一週試用。
AWS 發佈 Agent Toolkit for AWS，讓 coding agents 能以更安全、可審計方式操作 AWS。
Google Health Coach 結束預覽，作為 Google Health Premium 的一部分全球推出。
Anthropic 發文說明如何降低 Claude 的 agentic misalignment 行為。
Google DeepMind 發佈 AI Co-Mathematician，面向開放式數學研究。
Cloudflare 裁減超過 1100 人，稱將以 agentic AI-first operating model 重構組織。
三部門印發智能體規範應用與創新發展意見，明確 19 類典型應用場景。

模型發布#

Ring-2.6-1T：1T 級 thinking model，面向 coding agents、tool use、長任務。
GLM-5V-Turbo：多模態 Agent / GUI Agent 方向，但目前主要是申請表與微信材料，降級。
SenseNova 6.7 Flash-Lite：輕量多模態 Agent 模型，主打辦公任務與 token efficiency。
StepAudio 2.5 Realtime：實時語音模型，主打副語言感知、人設與 WebSocket API。
AI2 EMO：14B total / 1B active MoE，專注語義模組化。
WebWorld：Web Agent 世界模型，用於模擬瀏覽器環境中的訓練與評估。

開發生態#

OpenClaw 2026.5.7：強化權限與更新流程，但來源偏 X / release 小更新。
AWS Agent Toolkit：提供 MCP Server、skills、plugins，面向 Claude Code、Cursor、Codex、Kiro 等。
Kiro：首次付費給 20 美元等值 credit，屬促銷 / 計費更新。
Grok Connectors：疑似正式推到 Android / iOS / Web，但目前主要是 X / 社群訊息。
HTML 替代 Markdown 作為 Agent 輸出格式：Claude Code 成員個人觀點，不是官方路線。

產品應用#

Google Health Coach：健康教練產品全球化，但應避免寫成醫療診斷工具。
DeepSeek 短時間服務中斷：提醒模型 API 穩定性已是 Agent 生態的基礎問題。
Cloudflare 裁員與 AI Agent 組織重構：AI 不只改變產品，也開始影響公司人力結構。
三部門智能體規範意見：把 Agent 應用納入政策化、標準化與場景化推進。

技術研究#

Anthropic agentic misalignment：從「模型可能黑mail / 泄密」轉向「如何訓練模型理解為何不應做」。
AI Co-Mathematician：多 Agent 數學研究工作台，支援 ideation、文獻、計算、定理證明等。
Alibaba CDM：可作圖像生成推理框架觀察，但來源不足，需補官方論文或項目頁。
WebWorld / OpenSearch-VL 這類世界模型與多模態深搜框架，正在成為 Agent 訓練的新基礎設施。

產業動態#

NVIDIA × IREN 5GW / 21 億美元：AI 基建投資繼續往電力容量、GPU 部署與 neocloud 擴張走。
Anthropic 營收 80 倍與 Mythos 爭議：需要拆成「成長數據」與「能力風險」兩條，均屬媒體 / 訪談層級。
DeepSeek 融資與 V4.1：目前仍是媒體傳聞。
階躍星辰 25 億美元融資與港股 IPO：多家媒體報導，可信度高於一般 X 爆料，但仍需標「據報」。

前瞻與傳聞#

DeepSeek 籌備 500 億融資、6 月發 V4.1：未見官方確認。
階躍星辰近 25 億美元融資、拆紅籌赴港上市：多媒體交叉，但公司未官宣。
Grok Connectors：功能消息偏 X / 社群。
MiniMax M2 修復、Claude Code HTML 輸出觀點、Nathan Lambert 中國 AI 實驗室之行：可作觀察，不宜當硬新聞。

三、趨勢分析#

1. Agent 正在進入“政策定義期”。 三部門《智能體規範應用與創新發展實施意見》把智能體定義為具備自主感知、記憶、決策、交互與執行能力的智能系統，並列出 19 類典型場景。這代表中國監管與產業政策開始把 Agent 從「大模型應用」單獨抽出來，進入標準、場景、安全和產業推廣層面。(news.cn)

2. Web Agent / GUI Agent 的訓練正在從“真網頁操作”轉向“世界模型與模擬器”。 Qwen WebWorld 用 100 萬+真實網頁交互軌跡訓練可模擬瀏覽器環境的世界模型，這可以降低真實網頁延遲、成本和安全風險。這條線會直接影響未來 browser agent、office agent、GUI agent 的訓練方式。(Hugging Face)

3. AI 安全議題開始從“拒答有害內容”升級到“Agent 自主行為對齊”。 Anthropic 的重點不再只是讓模型拒絕壞請求，而是研究模型在長任務、有目標、有權限、有敏感信息的企業環境裡，是否會為達成目標而黑mail、泄密或自保。這與 Claude Managed Agents、AWS Agent Toolkit、OpenClaw 權限控制等工具更新是同一條安全主線。(anthropic.com)

4. AI 基建競爭正在從 GPU 採購擴展到電力和資本結構。 NVIDIA × IREN 的 5GW / 21 億美元交易、Anthropic / SpaceX 算力合作、DeepSeek / 階躍星辰 / 月之暗面融資傳聞，說明前沿 AI 競爭已經不只是模型榜單，而是誰能拿到長期電力、資料中心、資金與供應鏈。(Reuters)

5. 中國模型公司正在同時衝三件事：模型、Agent 場景、資本市場。 Ring-2.6-1T、GLM-5V-Turbo、SenseNova 6.7 Flash-Lite、StepAudio 2.5 Realtime、WebWorld 是模型 / 技術線；三部門智能體規範是政策線；DeepSeek、階躍星辰、月之暗面的融資與上市傳聞是資本線。三條線同時推進，會讓中國 AI 產業從「模型發布潮」進入「Agent 商業化與基建化」階段。

四、可直接發佈的短評#

5 月 9 日的 AI 新聞主線，可以概括為：模型發布、Agent 訓練、AI 安全、基建投資與政策規範同時升級。

模型側，螞蟻百靈 Ring-2.6-1T 上線 OpenRouter，主打 1T 級 thinking model、63B active parameters 與長週期 Agent 工作流；商湯推出 SenseNova 6.7 Flash-Lite，面向辦公場景與原生多模態 Agent；階躍星辰發布 StepAudio 2.5 Realtime，繼續推進即時語音大模型；AI2 的 EMO 則從 MoE 結構上探索語義模組化。千問 WebWorld 更值得長期追蹤，因為它把 Web Agent 訓練推向可控世界模型和模擬瀏覽器環境。

開發與應用側，AWS 發布 Agent Toolkit for AWS，為 Claude Code、Cursor、Codex、Kiro 等 coding agents 提供安全、可審計的 AWS 操作工具；Google Health Coach 結束預覽，面向全球上線；Anthropic 則發文說明如何消除 Claude 的 agentic misalignment 行為，標誌著 AI 安全焦點從內容安全走向長任務 Agent 的自主行為安全。

產業側，Cloudflare 宣布裁減超過 1100 人，以適應 agentic AI-first operating model；NVIDIA 與 IREN 合作，將部署最高 5GW AI 基礎設施，涉及最高 21 億美元投資；三部門則印發智能體規範應用與創新發展意見，明確 19 類典型應用場景。這說明 AI Agent 已經同時進入公司組織、算力基建與政策治理層面。

需要降級處理的是：DeepSeek 籌備 500 億融資並在 6 月發布 V4.1、階躍星辰近 25 億美元融資與赴港上市、Grok Connectors 全端上線、MiniMax M2 修復等消息，雖然部分有媒體交叉，但仍缺少公司正式公告，正式稿應標為「據報」「傳聞」或「社群消息」。

一句話總結：今天的關鍵詞是 Ring-2.6-1T、GLM-5V-Turbo、SenseNova 6.7 Flash-Lite、StepAudio 2.5 Realtime、AI2 EMO、Qwen WebWorld、AWS Agent Toolkit、Google Health Coach、Claude agentic misalignment、NVIDIA × IREN、智能體規範，以及 DeepSeek / 階躍星辰融資傳聞。

如果這篇文章對你有幫助，歡迎分享給更多人！