🤖 AI Research Daily - 2026-04-12

2026-04-12

Now I have comprehensive data. Let me compile the full report in Telegram HTML format.

🔬 AI 行业周报 — 2026 年 4 月 12 日

━━━━━━━━━━━━━━━━━━━━ 一、前沿模型动态 ━━━━━━━━━━━━━━━━━━━━

Anthropic • Claude Mythos Preview（4 月 7 日）— Anthropic 迄今最强模型，10 万亿参数，在网络安全任务上表现惊人。已发现数千个 zero-day 漏洞，包括 OpenBSD 中一个存在 27 年的 bug。通过 Project Glasswing 限量开放给 40 家机构（含 Microsoft、Apple、Amazon、CrowdStrike 等），不对外公开发布。这是一个分水岭事件——AI 首次在大规模漏洞发现上超越人类安全研究员。 • Claude Opus 4.6（2 月 5 日）/ Sonnet 4.6（2 月 17 日）已稳定运行。Sonnet 4.6 在 GDPval-AA Elo 排行 1,633 分领跑，1M token 上下文窗口，编码性能逼近 Opus。

OpenAI • GPT-5.4（3 月 5 日）— 1M token 上下文窗口，OSWorld-V 基准 75%，GDPval 测试 83%。核心突破在 自主多步工作流执行：能跨软件环境自主操作桌面任务，标志从”对话工具”到”数字同事”的转变。 • OpenAI 已宣布计划开发对标 Claude Mythos 的网络安全专用模型。

Google DeepMind • Gemini 3.1 Pro（2 月 19 日）— 在 16 项基准中 13 项领先，ARC-AGI-2 得分 77.1%。 • Gemma 4（4 月 2 日）— 开源里程碑。首次采用 Apache 2.0 许可证。四个变体（2B/4B/26B MoE/31B Dense），支持文本+图像+音频多模态，256K 上下文，可在手机和 Raspberry Pi 上离线运行。下载量累计超 4 亿次。 • TurboQuant（ICLR 2026）— KV cache 压缩算法，大幅降低推理内存开销。

Meta • Muse Spark（4 月 8 日）— Meta 首个闭源模型。由 Alexandr Wang 领导的 Meta Superintelligence Labs 开发（收购 Scale AI 后组建，$143 亿交易）。原生多模态推理，支持 tool-use 和多 agent 编排。自称对标 GPT-5.4 和 Sonnet 4.6。数周内将接入 WhatsApp、Instagram、Facebook、Ray-Ban 眼镜。 • 这意味着 Meta 的开源策略出现重大转向——Llama 系列仍在，但旗舰模型转为闭源。

xAI (SpaceX) • Grok 4.20 Beta 2（4 月 1 日）— 改进指令跟随和减少幻觉。引入多 agent 架构。 • Grok 5 延期至 Q2 2026，超级集群从 1GW 扩容至 1.5GW。 • 2 月 SpaceX 以 $1.25 万亿估值收购 xAI，目标是开发太空轨道数据中心，计划年内 IPO。

━━━━━━━━━━━━━━━━━━━━ 二、中国 AI 实验室 ━━━━━━━━━━━━━━━━━━━━

DeepSeek • V4 即将发布（4 月 8 日 TechNode 曝光测试界面）— 约 1 万亿参数 MoE，37B 活跃参数，1M 上下文窗口，原生多模态。Reuters 报道将在”未来几周”发布，且将运行在华为最新芯片上。V4 Lite 已于 3 月 9 日短暂出现在官网。 • R2 仍延期，据报道训练困难与 Ascend 硬件有关。 • 中国模型在 OpenRouter 上的周 token 消耗量已于 2 月超越美国模型。

Alibaba (Qwen) • 继续作为中国开源 volume leader，高度宽松许可证。生态持续扩大。

Baidu • DeepSeek 冲击后被迫从闭源转向开放，Ernie Bot 4 月初提前免费开放。

ByteDance • 同时作为模型开发者、分发平台（TikTok/抖音）和基础设施提供商——垂直整合程度西方无人匹敌。

全球扩散 • 新加坡 OCBC 银行用 DeepSeek+Qwen 运行 30+ 内部工具；印尼 Indosat 基于 DeepSeek 构建；马来西亚在华为硬件上建主权 AI 生态。

━━━━━━━━━━━━━━━━━━━━ 三、欧洲 / 日韩 ━━━━━━━━━━━━━━━━━━━━

Mistral AI（法国） • 获得 $8.3 亿债务融资，在巴黎南部建设数据中心（13,800 NVIDIA GPU，44MW），计划 2026 下半年上线，2027 年扩展至全欧 200MW。发布《European AI: A Playbook to Own It》，主推欧洲 AI 主权。

英国 • Nscale（AI 数据中心）融资 $20 亿，Wayve（自动驾驶）融资 $12 亿。

韩国 • Naver：投入超 1 万亿韩元用于 GPU 和 AI 基础设施，推出 Agent N，Q1 上线 AI 购物 agent，Q2 搜索 AI tab。正基于 OpenClaw 开发 B2B AI agent。 • Kakao：Kanana AI 将在 H1 2026 全面接入 KakaoTalk 和 Kanana Search。 • 韩国已通过《AI 基本法》，5 家公司已获认证出海。

日本 • NTT 采用 AI-native 开发模式；与韩国 ESTsoft 合作在出租车部署对话 AI。

━━━━━━━━━━━━━━━━━━━━ 四、基础设施与芯片 ━━━━━━━━━━━━━━━━━━━━

NVIDIA GTC 2026 核心发布 • Vera Rubin — 全栈计算平台（7 芯片 + 5 机架系统 + 1 超算），面向 agentic AI。含新 Vera CPU 和 BlueField-4 STX 存储架构。 • 下一代架构 Feynman 及 Rosa CPU 已公布路线图。 • Jensen Huang 宣布”agentic AI 拐点”到来。CPU 而非 GPU 正成为 agent 工作流的瓶颈。 • AWS 计划部署超 100 万 NVIDIA GPU；Google Cloud 将首批部署 Vera Rubin NVL72。 • NVIDIA 预测 AI 芯片需求达 $1 万亿。 • Isaac GR00T 开放模型让机器人理解自然语言并执行复杂多步任务。

━━━━━━━━━━━━━━━━━━━━ 五、重要研究突破 ━━━━━━━━━━━━━━━━━━━━

• 神经符号混合推理 — 结合神经网络与符号推理，能耗降低 100 倍且精度提升（将在 ICRA Vienna 发表） • TurboQuant（Google，ICLR 2026）— PolarQuant 向量旋转 + 量化 JL 压缩，大幅缩减 KV cache • Physics-informed ML 新算法（夏威夷大学，AIP Advances）— 让 AI 在处理复杂数据时遵守物理定律 • World Models 突破年 — 2026 被标记为可靠 world model 和持续学习原型的突破年 • Brevity Constraints 论文（3 月）— 发现约束大模型输出简短反而提升准确率 26 个百分点，逆转了模型性能层级

━━━━━━━━━━━━━━━━━━━━ 六、关键人物动态 ━━━━━━━━━━━━━━━━━━━━

Yann LeCun • 离开 Meta 十二年后创办 AMI Labs，融资 $10.3 亿（估值 $35 亿），押注 World Models——认为 LLM 是死路。团队包括 Saining Xie（首席科学官）、Meta 欧洲前 VP Laurent Solly（COO）。投资人含 Eric Schmidt、Mark Cuban、Bezos Expeditions。 • 4 月 1 日 Brown 大学演讲：“AI sucks. 它能操纵语言所以我们以为它聪明，但它对世界毫无概念。” • 4 月 7 日被任命为 AI Alliance 首席科学顾问，领导 Project Tapestry（开放主权 AI）。 • 4 月 12 日评论 Mythos：“Mythos drama = BS from self-delusion.”

Andrej Karpathy • 发布 LLM Wiki 概念——用 LLM 自动构建和维护个人知识库。将原始研究材料丢进文件夹，LLM 自动生成互联的百科文章、分类、反向链接。他的单主题研究 wiki 已增长到约 100 篇文章、40 万字。次日发布了完整架构 idea file（GitHub gist），设计为可直接复制进 LLM agent。 • 核心转变：从”用 AI 写代码”转向”用 AI 思考和组织知识”。

Ilya Sutskever (SSI) • 获 2026 年美国国家科学院工业应用科学奖（AI 领域首次）。去年 7 月接任 SSI CEO（联合创始人 Daniel Gross 离开加入 Meta 后）。SSI 估值 $320 亿，累计融资超 $30 亿，在特拉维夫保持重要研发团队。仍未发布任何产品——纯粹追求安全超级智能。

Simon Willison • 4 月持续高产：评论 Mythos / Project Glasswing（4/7）、Axios 供应链攻击分析（4/3）、Lenny’s Podcast 对话 agentic engineering（4/2）、SQLite 3.53.0 大版本（4/11）、scan-for-secrets 0.2 发布、Meta Muse Spark 分析（4/8）。

资本与行业格局 • Q1 2026 风投总额 $2,672 亿：OpenAI $1,220 亿、Anthropic $300 亿（Series G） • MCP（Model Context Protocol）3 月安装量突破 9,700 万，已成为 agent 连接工具/API/数据的行业标准

━━━━━━━━━━━━━━━━━━━━ 七、值得玩的东西 ━━━━━━━━━━━━━━━━━━━━

1. OpenClaw — 247K stars github.com/openclaw/openclaw 开源个人 AI 助手，本地运行，接入 WhatsApp/Telegram/Slack/Discord/Signal/iMessage 等 50+ 平台。100+ 预配置 AgentSkills，可执行 shell、管理文件、web 自动化。独立开发者的瑞士军刀。

2. GitNexus — 17K+ stars github.com/abhigyanpatwari/GitNexus 零服务器、纯浏览器运行的代码知识图谱引擎。丢入 GitHub repo 或 ZIP，Tree-sitter 解析出函数/类/调用链，构建图数据库 + Graph RAG agent。给你的 AI 编码助手加上”架构视野”。

3. Caveman — ~5K stars github.com/JuliusBrussee/caveman Claude Code skill，让 agent 说”穴居人话”，砍掉 65% output token。有论文背书：简短约束反而提升准确率。含文言文模式。省钱又提效，纯粹的好创意。

4. oh-my-codex (OMX) — 2.8K stars github.com/Yeachan-Heo/oh-my-codex OpenAI Codex CLI 的编排层。每个 worker 独立 git worktree，leader 自动合并。内置 $team（并行执行）、$autopilot（从想法到 QA 全自动）、$ralplan（Planner→Architect→Critic 共识规划）。类似 oh-my-zsh 之于 zsh。

5. Karpathy 的 LLM Wiki 架构 karpathy.ai（GitHub gist 架构文件）将研究材料丢进文件夹，LLM 自动构建并维护互联百科。架构 gist 设计为直接粘贴进任何 LLM agent。适合做个人知识管理系统或二次开发。

6. Gemma 4 Edge 模型 deepmind.google/models/gemma/gemma-4 Apache 2.0 许可，2B/4B 参数可在手机和 Raspberry Pi 离线运行，支持文本+图像+音频。适合边缘设备 AI 应用开发。

7. andrej-karpathy-skills GitHub trending 上的 CLAUDE.md 配置文件，基于 Karpathy 观察 LLM 编码陷阱的经验优化 Claude Code 行为。直接可用。