AI News｜2026-06-09 — Charles Cheng

今日目录

Boris Cherny 给出长时运行 Claude Code 的 5 个实操要点
Aaron Levie 判断模型分层会加速，调度层会变成新价值点
Box 继续把文件系统接入 AI 工作流：网页 Markdown、CLI 和桌面挂载齐上
Aaron Levie 反驳 AI 会快速吞掉企业软件的简单叙事
Vercel AI Gateway 披露每月可恢复超 1T token 请求
Madhu Guru 提醒：高价值训练数据仍是知识工作 agent 的瓶颈
Codex 启动 100 天高配额实验，想看重度用户到底能做出什么

今日判断

我今天更关注两件事：一是大家开始把注意力从单次 prompt，明显转到可持续运行的 loop、routing 和 self-verification；二是这些讨论不再停留在概念层，而是开始落到具体权限模式、云端执行、多 agent 编排、模型分层调度这些工程细节上。看下来，真正有价值的信息都来自在做产品的人，他们讲的是怎么让 agent 连续跑几个小时、怎么把失败率和成本压下去，而不是再争论哪个模型一句话更聪明。

我也感觉到一个很实在的分水岭：前沿模型继续负责高价值、长链路、需要判断的任务，便宜模型接走高频、可拆解的流水线任务。这样一来，产品壁垒不只是模型能力，而是你有没有 routing、重试、验证、权限管理和外部工具接入这一整套系统。我今天的判断是，接下来一线 builder 的差距，会越来越多地体现在 agent runtime 设计，而不是提示词技巧。

另外，企业侧并没有像很多人之前说的那样，因为 AI 降低软件开发门槛就自动被颠覆。Aaron Levie 讲得很直白：真正难的是落地、集成、支持和采购路径。这和前面的 agent 话题其实连在一起——如果你的 AI 产品不能进入真实文件系统、真实工作流、真实审批链路，再强的模型也只是 demo。我看下来，接下来能沉淀成长期价值的，不是会说 AI 的团队，而是能把 agent 接进现有系统并跑出稳定结果的团队。

快讯

1. Boris Cherny 给出长时运行 Claude Code 的 5 个实操要点

查看原文 · 来源：Boris Cherny (@bcherny)

Boris Cherny 总结了让 Opus 连续跑数小时到数天的 5 个做法：自动权限、动态工作流、多 agent 编排、云端运行，以及端到端 self-verification，还点名了浏览器扩展、移动端模拟器和本地服务启动这些具体工具链。我今天会把这条放在最前面，因为它不是在讨论模型排行榜，而是在讲 agent 真正落地时最关键的运行条件。我的判断是，长时任务能不能跑起来，瓶颈已经不只是模型本身，而是你有没有把权限、执行环境和验证闭环设计好。

2. Aaron Levie 判断模型分层会加速，调度层会变成新价值点

查看原文 · 来源：Aaron Levie (@levie)

Aaron Levie 认为，未来一两年用例会明显分层：高价值复杂任务继续吃 frontier 模型，大规模高频任务会被剥离到更便宜的模型上。随之而来的关键问题，不是选哪家模型，而是谁能把不同任务高效路由到合适模型，同时兼顾成功率和成本。我看这条的重要性在于，它把很多团队正在碰到的现实说清楚了：模型越来越多，真正难的是调度。我的判断是，下一轮 agent 基础设施的护城河，会更偏向 routing、fallback 和 cost-aware orchestration。

3. Box 继续把文件系统接入 AI 工作流：网页 Markdown、CLI 和桌面挂载齐上

查看原文 · 来源：Aaron Levie (@levie)

Aaron Levie 宣布 Box 现在支持网页端 Markdown 编辑、完整 CLI、评论和版本历史，同时 Box Drive 可以把企业文件挂载给 Claude、Codex、Obsidian、Cursor 等桌面客户端直接使用。我会选这条，是因为它说明企业文件层正在主动适配 AI-native 工作方式，而不是等 AI 厂商来统一入口。我的判断是，谁能把 AI 工具无缝接进现有内容资产和权限体系，谁就更有机会成为企业 agent 的默认上下文层。

4. Aaron Levie 反驳 AI 会快速吞掉企业软件的简单叙事

查看原文 · 来源：Aaron Levie (@levie)

Aaron Levie 说，很多人误判了 AI 对企业软件的影响。开发软件本身也许变便宜了，但企业软件的大头成本一直在销售、实施、集成和支持，这些环节在 AI 时代并没有消失，甚至更复杂。我看这条的价值在于，它提醒 builder 不要把 demo 能力误当成可销售产品。我的判断是，企业 AI 创业的门槛没有降到想象中那么低，反而更考验你能不能把 agent 交付到采购、权限、合规和现有系统里。

5. Vercel AI Gateway 披露每月可恢复超 1T token 请求

查看原文 · 来源：Guillermo Rauch (@rauchg)

Guillermo Rauch 提到，Vercel AI Gateway 平均每月能恢复超过 1T tokens 的请求量，并把这件事类比为 Stripe 的支付重试：通过冗余、零数据保留、可观测性、使用量 API 和额度控制，把原本会失败的推理调用捞回来。我今天会保留它，因为这不是单纯炫数字，而是点出 AI 网关的真实作用：不是包一层 API，而是提升可用性和治理能力。我的判断是，随着 agent 调用链变长，失败恢复会从加分项变成基础设施标配。

6. Madhu Guru 提醒：高价值训练数据仍是知识工作 agent 的瓶颈

查看原文 · 来源：Madhu Guru (@realmadhuguru)

Madhu Guru 的观点很直接：真正推动模型前沿的数据，不是低技能标注，而是高经济价值任务里的隐性知识。软件工程之所以先被 agent 化，是因为代码、工具链和反馈回路都更结构化；而很多非 SWE 知识工作散落在旧系统、口口相传的流程和难以数字化的判断里。我看这条的价值在于，它解释了为什么很多通用知识工作 agent 仍然不稳定。我的判断是，接下来谁能构造高质量、可验证、领域化的数据闭环，谁才可能把 agent 推进到更多真实岗位。

7. Codex 启动 100 天高配额实验，想看重度用户到底能做出什么

查看原文 · 来源：Thibault Sottiaux (@thsottiaux)

Thibault Sottiaux 宣布，未来 100 天里每天会选一个用 Codex 做出高质量或高实用性成果的人，给他一个月 10 倍使用限额，看看他们能把工具推到什么程度。我会留下这条，不是因为活动本身，而是因为它反映出 coding agent 团队正在主动研究一个关键问题：限制放开后，重度用户的真实工作流会怎样变化。我的判断是，下一波工具进化不会只来自模型升级，还会来自对 power user 行为的系统性观察。

今日目录

今日判断

快讯

1. Boris Cherny 给出长时运行 Claude Code 的 5 个实操要点

2. Aaron Levie 判断模型分层会加速，调度层会变成新价值点

3. Box 继续把文件系统接入 AI 工作流：网页 Markdown、CLI 和桌面挂载齐上

4. Aaron Levie 反驳 AI 会快速吞掉企业软件的简单叙事

5. Vercel AI Gateway 披露每月可恢复超 1T token 请求

6. Madhu Guru 提醒：高价值训练数据仍是知识工作 agent 的瓶颈

7. Codex 启动 100 天高配额实验，想看重度用户到底能做出什么

Subscribe to AI News