🤖 AI Research Daily - 2026-04-04

以下是今日(2026-04-04)AI 领域简报:


1. Google 发布 Gemma 4 开源模型家族 Apache 2.0 授权,四档规格覆盖边缘设备到数据中心;31B Dense 模型在 Arena 排行榜排名第三,且可在单张消费级 GPU 上运行,直接对标 DeepSeek 等中国开源模型。对从业者意义:本地部署 frontier 级能力的门槛大幅降低,多模态+agent 能力开箱即用。 Google Blog

2. Microsoft 推出三款自研 AI 基础模型 MAI-Transcribe-1(语音转文字,在 FLEURS 基准 25 语言全面超越 OpenAI Whisper)、MAI-Voice-1(TTS,1 秒生成 60 秒自然语音)、MAI-Image-2(图像生成,Arena 前三)。10 人团队造出超越 OpenAI 的语音模型——意味着微软正在战略性摆脱对 OpenAI 的依赖,对生态格局影响深远。 VentureBeat

3. Sakana AI 的 AI Scientist-v2 论文通过同行评审 全程无人工干预、由 AI 系统独立完成的论文首次通过 ICLR workshop 审稿,超过人类平均录取线。系统通过 agentic tree search 自主提出假设、设计实验、分析数据、撰写论文。意义:AI 自动化科研进入”可验证里程碑”阶段,科研流程本身将被重塑。 arXiv

4. 加州 AI 监管全面提速,或成美国事实标准 Newsom 本周签署 AI 行政令,要求与州合作企业公开非法内容政策、模型偏见问题;州议会同步推进多项 AI 法案(含未成年人保护)。与此同时,特朗普政府力推联邦预占州法——两套框架的博弈将决定未来数年 AI 合规路径。 Axios

5. LLM 推理研究新发现:“想更久”不等于”更聪明” 最新研究发现 chain-of-thought 开启后,模型对错误答案消耗的算力反而多于正确答案,且回答一致性下降。这对当前普遍依赖”长思考链”提升推理能力的路线提出了系统性质疑,值得关注推理模型产品方向的从业者重新评估。 arXiv