🤖 AI Research Daily - 2026-04-10

报告已整合完成,以下是 Telegram HTML 格式输出:

**🔬 AI 行业周报 | 2026.04.10**

━━━━━━━━━━━━━━━━━━━

**一、美国实验室动态**

**▎Anthropic**
• **Claude Mythos Preview**(4/7)— 专为网络安全设计的模型,已发现数千个未知 zero-day 漏洞。配套启动 **Project Glasswing**,联合 Microsoft、Amazon、Apple、Google、NVIDIA 等 40+ 公司,仅限防御性用途。意义:首次将前沿 LLM 系统性投入漏洞挖掘。
• **Claude Sonnet 4.6** — agentic search 性能提升,token 消耗降低,1M context window,支持 extended thinking。
• **Managed Agents** 进入公开 beta — 全托管 agent 沙箱,支持 SSE 流式输出。
• **ant CLI** — 官方命令行 API 客户端,YAML 版本化资源管理。
• 与 CoreWeave 签多年算力租赁协议(多种 NVIDIA 芯片架构)。
• ⚠️ D.C. 巡回法院(4/8)驳回 Anthropic 紧急动议,维持五角大楼对 Claude 军事用途禁令。

**▎OpenAI**
• 完成 $1220 亿融资,估值 $8520 亿,月收入 $20 亿。CFO Sarah Friar 确认 IPO 将向散户开放。
• **Codex** 扩展至 Business/Enterprise,新增 Codex-only 席位,用户突破 300 万。
• **Sora 停运** — 日烧 $100 万不可持续,转向企业工具。
• 发布 Child Safety Blueprint 和 Safety Fellowship(4/8)。

**▎Google DeepMind**
• **Gemma 4**(4/2)— 四个规格(E2B / E4B / 26B MoE / 31B Dense),Apache 2.0 开源。原生多模态(文本/图像/音频),140+ 语言,可在手机和 Raspberry Pi 上近零延迟离线运行。基于 Gemini 3 同源技术,专为 agentic workflow 设计。*开源模型首次在边缘设备实现如此广泛的多模态能力。*

**▎Meta AI**
• **Muse Spark**(4/8)— Meta Superintelligence Labs(Alexandr Wang 领导)首个模型。原生多模态推理,支持 visual chain of thought、tool-use、multi-agent 编排。**重要转向:这是 Meta 首个闭源专有模型**,打破一贯开源策略。已部署至 Meta.ai,将逐步替换 Facebook/Instagram/WhatsApp 中的 Llama。

**▎xAI**
• **Grok 5** 确认规格:6T 参数 MoE,在 Colossus 2(1.5GW)上训练,预计 Q2 公测。
• **Grok Imagine 1.0**:10 秒视频生成,30 天内生成 12.45 亿条视频。
• SpaceX 收购 xAI,加速算力建设。

**▎NVIDIA**
• 以 $200 亿收购推理芯片公司 Groq,推出 **Groq 3 LPX** 推理加速器。
• Physical AI 研究:机器人从虚拟训练到真实部署速度大幅提升。

**▎Apple**
• 仍然保守 — 2026 capex 仅 $140 亿(对比四巨头合计 $7000 亿)。Siri 大改版预计春季推出,支持多步骤任务和第三方模型集成。

━━━━━━━━━━━━━━━━━━━

**二、中国 AI**

**▎智谱 AI (Zhipu / Z.ai)**
• **GLM-5.1**(4/7)— 744B MoE(40B 活跃参数/token),200K context,131K max output,MIT 开源。**SWE-Bench Pro 得分 58.4,超过 GPT-5.4(57.7)、Claude Opus 4.6(57.3)、Gemini 3.1 Pro(54.2)** — *首个在该基准上全面超越闭源模型的开源模型*。单任务可持续执行 8 小时。

**▎DeepSeek**
• **V4** 尚未正式发布,4/8 悄然上线产品分层(Fast Mode / Expert Mode / Vision)。规格:~1T MoE(~37B 活跃参数),1M context,Engram conditional memory,原生多模态生成。将在华为芯片上运行。SWE-bench 81%,$0.30/MTok。预计数周内发布。

**▎阿里 (Qwen)**
• **Qwen 3.6-Plus**(4/2)— 旗舰模型,agentic coding 和多模态感知/推理显著提升。

**▎腾讯**
• **混元 3.0** 计划 4 月发布,约 300 亿参数,同步开发微信 AI Agent。

**▎MiniMax**
• **M2.7**(4 月初)— "self-evolving" 训练方法,SWE-Pro 56.22%,推理速度比竞品快 3x。2026 年 1 月港股上市首日翻倍。

**▎月之暗面 (Moonshot)**
• Kimi K2.5 发布不到一个月收入超 2025 全年。

**▎字节跳动**
• 垂直整合优势独特:模型(豆包)+ 分发(抖音/TikTok)+ 基础设施。豆包是中国最受欢迎的 AI 聊天机器人。

━━━━━━━━━━━━━━━━━━━

**三、欧洲 AI**

**▎Mistral AI**
• 发布 ["European AI: a playbook to own it"](https://europe.mistral.ai/)(4/7),提出 22 条推动欧洲 AI 主权的紧急措施。
• 融资 $8.3 亿债务建设基础设施,巴黎南部 44MW 数据中心预计下半年上线,目标 2027 年底 200MW。估值 €117 亿。

**▎EU AI Act**
• **2026 年 8 月 2 日**为主要执行日期,目前合规准备阶段。严重违规罚款可达全球年收入 7%。
• 欧盟同时讨论"简化" AI Act 和 GDPR,人权组织表达担忧。

━━━━━━━━━━━━━━━━━━━

**四、日韩**

**▎韩国**
• **NAVER**:投资超 1 万亿韩元于 GPU 和 AI 基础设施,Q1 推 AI 购物 agent,Q2 推 AI 搜索 tab。
• **Samsung**:与 NVIDIA 合建 AI mega-factory(50,000+ GPU),AI 融入半导体/移动/机器人全生产链。
• **韩国 AI 基本法**已生效,5 家本土公司获选建设主权 AI 模型。

**▎日本**
• 日美韩签署 Technology Prosperity Deals,涉及 AI、半导体、量子计算、6G。

━━━━━━━━━━━━━━━━━━━

**五、开源模型一览**

• **GLM-5.1**(智谱)— 744B MoE,MIT,SWE-Bench Pro #1
• **Gemma 4**(Google)— 边缘多模态,Apache 2.0
• **MiniMax M2.7** — self-evolving 训练,3x 推理速度
• **Llama 4**(Meta)— Scout 10M context,Maverick 400B+
• **DeepSeek V3.2** — 开源推理和 Agent 最强之一

━━━━━━━━━━━━━━━━━━━

**六、宏观趋势**

• **VC**:2026 Q1 全球 AI 风投 $2420 亿,占全部风投约 80%
• **Agentic AI 落地**:Microsoft Copilot Cowork、Anthropic Conway、Salesforce Slackbot 进入实际部署,真实失败模式开始浮现
• **开源 vs 闭源格局剧变**:GLM-5.1 首次在 SWE-Bench Pro 超越所有闭源模型;Meta 反向走闭源引发争议
• **算力军备竞赛**:四巨头合计 capex ~$7000 亿,xAI Colossus 扩至 1.5GW

━━━━━━━━━━━━━━━━━━━

**七、值得玩的东西**

**Agent & 记忆**

• [NousResearch/hermes-agent](https://github.com/NousResearch/hermes-agent) ⭐50.6k
Agent 自动从对话中提取 skill 并进化,本周 GitHub 涨星最猛(+19.7k)

• [mempalace](https://github.com/milla-jovovich/mempalace) ⭐35.7k
LongMemEval 基准 96.6% 的 AI 记忆系统,启动仅消耗 170 tokens,支持 Claude Code MCP 即插即用

• [OpenClaw](https://github.com/openclaw/openclaw) ⭐247k
一个 gateway 统一 25+ 聊天平台的个人 AI 助手,100+ 预配置 AgentSkills,架构值得研究

**AI 编码生态**

• [graphify](https://github.com/safishamsi/graphify)
把代码/文档/PDF 变成可查询知识图谱,Claude Code 一条命令安装,71.5x token 节省

• [oh-my-codex](https://github.com/Yeachan-Heo/oh-my-codex) ⭐20.4k
Codex CLI 的 oh-my-zsh — 33 个专业 prompt + 36 个工作流 + agent 团队协作

• [andrej-karpathy-skills](https://github.com/forrestchang/andrej-karpathy-skills) ⭐11.4k
基于 Karpathy 对 LLM 行为观察的 Claude Code 行为优化指南,纯知识型 skill

• [multica](https://github.com/multica-ai/multica) ⭐5.5k
开源 Agent 管理平台 — 你当 PM,Agent 当工程师,支持看板和进度汇报

**浏览器自动化**

• [browser-use](https://github.com/browser-use/browser-use) ⭐78k
AI Agent 控制浏览器的 #1 开源方案,100 个真实任务 benchmark 全开源

• [BrowserOS](https://github.com/browseros-ai/BrowserOS)
开源 Agentic 浏览器(Chromium fork),隐私优先,支持 Ollama 本地模型,Chrome 扩展全兼容

• [Lightpanda](https://github.com/lightpanda-io/browser)
Zig 从头写的 headless 浏览器,比 Chrome 内存少 9x、速度快 11x,爬虫/自动化性能怪兽

**创意项目**

• [MiroFish](https://github.com/666ghj/MiroFish) ⭐51k
群体智能预测引擎 — 生成上千个有独立性格的 AI Agent 在模拟世界交互输出预测。北邮大四学生 10 天完成,24 小时拿到陈天桥 3000 万投资

• [OpenScreen](https://github.com/siddharthvaddem/openscreen) ⭐27.4k
Screen Studio 开源替代 — 自动变焦、无水印、商用免费,独立开发者做 demo 的刚需

• [DeepTutor](https://github.com/HKUDS/DeepTutor) ⭐15.7k
Agent-Native 个性化学习助手,多 Agent 同时运行(苏格拉底导师 + 写作教练),做教育产品的现成方案

• [Mvidia](https://jaso1024.com/mvidia/)
HN 960 分热帖 — 从头搭建 GPU 的教育游戏,理解 GPU 架构最有趣的方式

报告已生成。由于 AI 人物动态那路 agent 没有联网能力未能搜到结果,其余两路(实验室动态 + GitHub/HN 项目)均已覆盖。如果你需要我通过 Telegram 发送,告诉我 chat_id 即可。