🤖 AI Research Daily - 2026-04-12
Now I have comprehensive data. Let me compile the full report in Telegram HTML format.
🔬 AI 行业周报 — 2026 年 4 月 12 日
━━━━━━━━━━━━━━━━━━━━ 一、前沿模型动态 ━━━━━━━━━━━━━━━━━━━━
Anthropic • Claude Mythos Preview(4 月 7 日)— Anthropic 迄今最强模型,10 万亿参数,在网络安全任务上表现惊人。已发现数千个 zero-day 漏洞,包括 OpenBSD 中一个存在 27 年的 bug。通过 Project Glasswing 限量开放给 40 家机构(含 Microsoft、Apple、Amazon、CrowdStrike 等),不对外公开发布。这是一个分水岭事件——AI 首次在大规模漏洞发现上超越人类安全研究员。 • Claude Opus 4.6(2 月 5 日)/ Sonnet 4.6(2 月 17 日)已稳定运行。Sonnet 4.6 在 GDPval-AA Elo 排行 1,633 分领跑,1M token 上下文窗口,编码性能逼近 Opus。
OpenAI • GPT-5.4(3 月 5 日)— 1M token 上下文窗口,OSWorld-V 基准 75%,GDPval 测试 83%。核心突破在 自主多步工作流执行:能跨软件环境自主操作桌面任务,标志从”对话工具”到”数字同事”的转变。 • OpenAI 已宣布计划开发对标 Claude Mythos 的网络安全专用模型。
Google DeepMind • Gemini 3.1 Pro(2 月 19 日)— 在 16 项基准中 13 项领先,ARC-AGI-2 得分 77.1%。 • Gemma 4(4 月 2 日)— 开源里程碑。首次采用 Apache 2.0 许可证。四个变体(2B/4B/26B MoE/31B Dense),支持文本+图像+音频多模态,256K 上下文,可在手机和 Raspberry Pi 上离线运行。下载量累计超 4 亿次。 • TurboQuant(ICLR 2026)— KV cache 压缩算法,大幅降低推理内存开销。
Meta • Muse Spark(4 月 8 日)— Meta 首个闭源模型。由 Alexandr Wang 领导的 Meta Superintelligence Labs 开发(收购 Scale AI 后组建,$143 亿交易)。原生多模态推理,支持 tool-use 和多 agent 编排。自称对标 GPT-5.4 和 Sonnet 4.6。数周内将接入 WhatsApp、Instagram、Facebook、Ray-Ban 眼镜。 • 这意味着 Meta 的开源策略出现重大转向——Llama 系列仍在,但旗舰模型转为闭源。
xAI (SpaceX) • Grok 4.20 Beta 2(4 月 1 日)— 改进指令跟随和减少幻觉。引入多 agent 架构。 • Grok 5 延期至 Q2 2026,超级集群从 1GW 扩容至 1.5GW。 • 2 月 SpaceX 以 $1.25 万亿估值收购 xAI,目标是开发太空轨道数据中心,计划年内 IPO。
━━━━━━━━━━━━━━━━━━━━ 二、中国 AI 实验室 ━━━━━━━━━━━━━━━━━━━━
DeepSeek • V4 即将发布(4 月 8 日 TechNode 曝光测试界面)— 约 1 万亿参数 MoE,37B 活跃参数,1M 上下文窗口,原生多模态。Reuters 报道将在”未来几周”发布,且将运行在华为最新芯片上。V4 Lite 已于 3 月 9 日短暂出现在官网。 • R2 仍延期,据报道训练困难与 Ascend 硬件有关。 • 中国模型在 OpenRouter 上的周 token 消耗量已于 2 月超越美国模型。
Alibaba (Qwen) • 继续作为中国开源 volume leader,高度宽松许可证。生态持续扩大。
Baidu • DeepSeek 冲击后被迫从闭源转向开放,Ernie Bot 4 月初提前免费开放。
ByteDance • 同时作为模型开发者、分发平台(TikTok/抖音)和基础设施提供商——垂直整合程度西方无人匹敌。
全球扩散 • 新加坡 OCBC 银行用 DeepSeek+Qwen 运行 30+ 内部工具;印尼 Indosat 基于 DeepSeek 构建;马来西亚在华为硬件上建主权 AI 生态。
━━━━━━━━━━━━━━━━━━━━ 三、欧洲 / 日韩 ━━━━━━━━━━━━━━━━━━━━
Mistral AI(法国) • 获得 $8.3 亿债务融资,在巴黎南部建设数据中心(13,800 NVIDIA GPU,44MW),计划 2026 下半年上线,2027 年扩展至全欧 200MW。发布《European AI: A Playbook to Own It》,主推欧洲 AI 主权。
英国 • Nscale(AI 数据中心)融资 $20 亿,Wayve(自动驾驶)融资 $12 亿。
韩国 • Naver:投入超 1 万亿韩元用于 GPU 和 AI 基础设施,推出 Agent N,Q1 上线 AI 购物 agent,Q2 搜索 AI tab。正基于 OpenClaw 开发 B2B AI agent。 • Kakao:Kanana AI 将在 H1 2026 全面接入 KakaoTalk 和 Kanana Search。 • 韩国已通过《AI 基本法》,5 家公司已获认证出海。
日本 • NTT 采用 AI-native 开发模式;与韩国 ESTsoft 合作在出租车部署对话 AI。
━━━━━━━━━━━━━━━━━━━━ 四、基础设施与芯片 ━━━━━━━━━━━━━━━━━━━━
NVIDIA GTC 2026 核心发布 • Vera Rubin — 全栈计算平台(7 芯片 + 5 机架系统 + 1 超算),面向 agentic AI。含新 Vera CPU 和 BlueField-4 STX 存储架构。 • 下一代架构 Feynman 及 Rosa CPU 已公布路线图。 • Jensen Huang 宣布”agentic AI 拐点”到来。CPU 而非 GPU 正成为 agent 工作流的瓶颈。 • AWS 计划部署超 100 万 NVIDIA GPU;Google Cloud 将首批部署 Vera Rubin NVL72。 • NVIDIA 预测 AI 芯片需求达 $1 万亿。 • Isaac GR00T 开放模型让机器人理解自然语言并执行复杂多步任务。
━━━━━━━━━━━━━━━━━━━━ 五、重要研究突破 ━━━━━━━━━━━━━━━━━━━━
• 神经符号混合推理 — 结合神经网络与符号推理,能耗降低 100 倍且精度提升(将在 ICRA Vienna 发表) • TurboQuant(Google,ICLR 2026)— PolarQuant 向量旋转 + 量化 JL 压缩,大幅缩减 KV cache • Physics-informed ML 新算法(夏威夷大学,AIP Advances)— 让 AI 在处理复杂数据时遵守物理定律 • World Models 突破年 — 2026 被标记为可靠 world model 和持续学习原型的突破年 • Brevity Constraints 论文(3 月)— 发现约束大模型输出简短反而提升准确率 26 个百分点,逆转了模型性能层级
━━━━━━━━━━━━━━━━━━━━ 六、关键人物动态 ━━━━━━━━━━━━━━━━━━━━
Yann LeCun • 离开 Meta 十二年后创办 AMI Labs,融资 $10.3 亿(估值 $35 亿),押注 World Models——认为 LLM 是死路。团队包括 Saining Xie(首席科学官)、Meta 欧洲前 VP Laurent Solly(COO)。投资人含 Eric Schmidt、Mark Cuban、Bezos Expeditions。 • 4 月 1 日 Brown 大学演讲:“AI sucks. 它能操纵语言所以我们以为它聪明,但它对世界毫无概念。” • 4 月 7 日被任命为 AI Alliance 首席科学顾问,领导 Project Tapestry(开放主权 AI)。 • 4 月 12 日评论 Mythos:“Mythos drama = BS from self-delusion.”
Andrej Karpathy • 发布 LLM Wiki 概念——用 LLM 自动构建和维护个人知识库。将原始研究材料丢进文件夹,LLM 自动生成互联的百科文章、分类、反向链接。他的单主题研究 wiki 已增长到约 100 篇文章、40 万字。次日发布了完整架构 idea file(GitHub gist),设计为可直接复制进 LLM agent。 • 核心转变:从”用 AI 写代码”转向”用 AI 思考和组织知识”。
Ilya Sutskever (SSI) • 获 2026 年美国国家科学院工业应用科学奖(AI 领域首次)。去年 7 月接任 SSI CEO(联合创始人 Daniel Gross 离开加入 Meta 后)。SSI 估值 $320 亿,累计融资超 $30 亿,在特拉维夫保持重要研发团队。仍未发布任何产品——纯粹追求安全超级智能。
Simon Willison • 4 月持续高产:评论 Mythos / Project Glasswing(4/7)、Axios 供应链攻击分析(4/3)、Lenny’s Podcast 对话 agentic engineering(4/2)、SQLite 3.53.0 大版本(4/11)、scan-for-secrets 0.2 发布、Meta Muse Spark 分析(4/8)。
资本与行业格局 • Q1 2026 风投总额 $2,672 亿:OpenAI $1,220 亿、Anthropic $300 亿(Series G) • MCP(Model Context Protocol)3 月安装量突破 9,700 万,已成为 agent 连接工具/API/数据的行业标准
━━━━━━━━━━━━━━━━━━━━ 七、值得玩的东西 ━━━━━━━━━━━━━━━━━━━━
1. OpenClaw — 247K stars github.com/openclaw/openclaw 开源个人 AI 助手,本地运行,接入 WhatsApp/Telegram/Slack/Discord/Signal/iMessage 等 50+ 平台。100+ 预配置 AgentSkills,可执行 shell、管理文件、web 自动化。独立开发者的瑞士军刀。
2. GitNexus — 17K+ stars github.com/abhigyanpatwari/GitNexus 零服务器、纯浏览器运行的代码知识图谱引擎。丢入 GitHub repo 或 ZIP,Tree-sitter 解析出函数/类/调用链,构建图数据库 + Graph RAG agent。给你的 AI 编码助手加上”架构视野”。
3. Caveman — ~5K stars github.com/JuliusBrussee/caveman Claude Code skill,让 agent 说”穴居人话”,砍掉 65% output token。有论文背书:简短约束反而提升准确率。含文言文模式。省钱又提效,纯粹的好创意。
4. oh-my-codex (OMX) — 2.8K stars github.com/Yeachan-Heo/oh-my-codex OpenAI Codex CLI 的编排层。每个 worker 独立 git worktree,leader 自动合并。内置 $team(并行执行)、$autopilot(从想法到 QA 全自动)、$ralplan(Planner→Architect→Critic 共识规划)。类似 oh-my-zsh 之于 zsh。
5. Karpathy 的 LLM Wiki 架构 karpathy.ai(GitHub gist 架构文件) 将研究材料丢进文件夹,LLM 自动构建并维护互联百科。架构 gist 设计为直接粘贴进任何 LLM agent。适合做个人知识管理系统或二次开发。
6. Gemma 4 Edge 模型 deepmind.google/models/gemma/gemma-4 Apache 2.0 许可,2B/4B 参数可在手机和 Raspberry Pi 离线运行,支持文本+图像+音频。适合边缘设备 AI 应用开发。
7. andrej-karpathy-skills GitHub trending 上的 CLAUDE.md 配置文件,基于 Karpathy 观察 LLM 编码陷阱的经验优化 Claude Code 行为。直接可用。