AI 日报速览：模型竞赛、智能体进化与基础设施军的融资狂潮（2026-06-03）

1547 words

8 minutes

2026-06-04

AI日报

/

模型发布

/

智能体

/

大模型

/

科技新闻

引言#

过去24小时，AI行业仿佛按下了加速键。微软首次拿出自研推理模型，Anthropic在上市竞赛中猛踩油门，而智能体从代码助手到视频编辑再到系统清理，正在变得前所未有的实用。

以下是对 AI HOT 日报·2026-06-03 核心内容的梳理与解读。

微软在 Build 2026 上发布了中等规模的推理模型 MAI-Thinking-1。其核心亮点是 完全从头训练，未蒸馏任何第三方模型，在关键软件工程基准上达到领先水平。这标志着微软在摆脱对 OpenAI 依赖、构建独立 AI 能力的道路上迈出关键一步。

Holo3.1 基于 Qwen 家族，提供从 0.8B 到 35B-A3B 四种尺寸，甚至包含量化版本。它在 AndroidWorld 基准上从 67% 跃升至 79.3%，量化后吞吐量提升 1.74 倍。对于需要本地运行、低成本部署的开发者，这是一个值得关注的选项。

196B 参数的 MoE 模型，亮点在于 KV-cache 成本仅为 DeepSeek 的 22%，且采用 Apache 2.0 许可。这种极致的成本控制策略，可能会让它在推理部署场景中具有很强的竞争力。

传统智能体在长任务中容易“注意力涣散”（智能惰性）。Claude Code 的新功能允许模型 在运行时即兴创建和协调多智能体框架。这意味着它可以动态拆分任务、委托给不同“子智能体”，然后合并结果。对于安全分析、多文件代码审查这类任务，这可能会显著提升完成质量。

pip install openai-codex 即可将 Codex 的能力嵌入应用。它内置了顶尖编程和图像生成 Agent，并能复用登录态。对于想快速为自己的应用添加 AI 开发能力的团队，这是一个低门槛的选项。

这两条消息放在一起非常有冲击力。Alphabet 融资主要用于扩展 AI 基础设施，显示巨头对算力军备竞赛尚未止步。而 Anthropic 在上市竞赛中领先 OpenAI，已秘密提交 IPO 申请。一个在融资，一个要上市，AI 行业对资本的需求到达了新的高度。

Anthropic 将其关键基础设施保护计划（Project Glasswing）扩展到约 150 个新组织，覆盖电力、医疗、通信行业，并推出 Claude Security 产品。同时，它公开支持美国 AI 行政令的实施。这表明头部 AI 公司正在从“技术输出”转向“安全与治理方案输出”。

主导了 OLMO 和 Tulu 等重磅开源模型的 Nathan Lambert 宣布离开 Ai2。开源社区失去了一位重要的贡献者，但他表示未来将继续深耕开放科学。

Anthropic 的 Transformer Circuits 团队提出了 TWERA（虚拟权重） 方法。它通过分析下游连接来预测某个特征的实际因果影响，从而区分“看似相关但实为干扰”的特征。这为识别模型内部真正的因果组件提供了新工具。

Aurora 模型在天气预报领域实现了数量级的加速。当大模型可以模拟超算级别的物理预测时，它对科学研究范式的颠覆才刚刚开始。

一位开发者用 Codex 分析磁盘，构建了一套跨平台 AI 清理 skill，三色分级展示可清理项，实测释放近 120G 空间。这展示了智能体在系统运维和日常工具开发中的潜力。

Karpathy 分享的学习方法在圈内引起热议，核心强调“理解原理而非死记参数”。
开放模型生态 方面，OpenRouter 数据显示开放权重模型贡献了 69.1% 的 token 使用量，闭源仅占 30.9%。DeepSeek 之后，MiniMax、Qwen 等正在接棒，竞争格局持续变化。