AI Builders Digest
今天的主线很清楚:agent 正在从聊天界面走向长期任务、文件系统、能力注册表和审查流程。真正的瓶颈正在从“能不能生成”转向“能不能稳定接入工作流”。
Claude Cowork、Vercel、Figma 都在把 agent 往“真实工作流”推进。
Vercel 的 agent 文件系统和 Skills API,可能成为平台层新基建。
后续 digest 可以直接生成网页,再用邮件或飞书只发入口链接。
今天的主线很清楚:agent 正在从聊天界面走向长期任务、文件系统、能力注册表和审查流程。真正的瓶颈正在从“能不能生成”转向“能不能稳定接入工作流”。
Claude Cowork、Vercel、Figma 都在把 agent 往“真实工作流”推进。
Vercel 的 agent 文件系统和 Skills API,可能成为平台层新基建。
后续 digest 可以直接生成网页,再用邮件或飞书只发入口链接。
Anthropic 在推动研究、报告、收件箱处理这类大任务。
文件系统状态和 Skills API 都指向更完整的平台层。
context、trigger、evals、memory 可以成为自动任务规范。
企业 AI 不该只服务今天的模型短板,要看 6 个月后的斜率。
Figma 的判断是软件数量暴增,可靠 SaaS 反而更值钱。
Claude Cowork、Vercel agent 文件系统、Skills API、GBrain / OpenClaw。
Figma Infinite Canvas、Cursor Composer 2.5,以及 AI 进入设计工作流。
AI skills、evals、memory、企业 AI 产品设计、prompt 习惯。
SaaS apocalypse 叙事、AI coding 和知识工作自动化边界。
Anthropic 的 Boris Cherny 和 Claude 官方账号都在推 Claude Cowork:未来一个月把 Cowork 的 5 小时使用限制翻倍,并开放到所有付费计划,持续到 7 月 5 日。
Boris 的定位很清楚:Cowork 最适合“比聊天更大的任务”,比如跨几十个账号研究、周期性报告、收件箱分拣和草拟回复。
Guillermo Rauch 讲了两个基础设施方向。第一,agent 的文件系统状态现在可以独立于 sandbox 生命周期读写和挂载,工作状态不再必须随着执行环境消失。
第二,他把 Skills API 类比成“agent 能力和扩展性的 npm registry”。未来 agent 平台比拼的不只是模型和执行环境,还有能力的分发、复用和治理。
Garry Tan 连续提到 GBrain、OpenClaw 和 Hermes Agent,并说一个几个月前预告的大项目现在可以试用。
他的表述重点是帮助用户学习更好的软件构建技巧,并更快构建软件。这更像是把 agent 从“替你写代码”推向“教你形成更好的构建方法”。
Peter Yang 给出了一套很实用的 AI skill 构建流程:先给上下文和好输出样例,再写清楚触发条件,然后加入 pass/fail evals,最后给 skill 加 memory,让它能记录过去聊天里的一句话经验。
他甚至建议再做一个“清理其他 skills 的 skill”,专门删除重复、过时、模糊和 AI 味太重的规则。这条最适合直接转化成我们后续自动任务的规范。
Madhu Guru 的判断是:企业 AI 团队最常见的错误之一,是按今天的模型能力和价格点来构建系统。
他的建议是看 6 个月后的斜率。今天为模型短板搭的脚手架,下一代模型可能会原生解决。所以真正的护城河不是某个 workaround,而是持续识别模型缺口、补上缺口、再推进边界的能力。
swyx 给了一个很小但有用的提示词习惯:把任务写成问题,让模型自然地推敲、反问、提出替代方案,而不是机械执行你说出的字面指令。
他的实用建议是,有时只要在 prompt 末尾加一个问号,就能让模型从“照做”切换到“判断这是不是好主意”。
Matt Colyer 是 Figma 的 Director of Product Management for Developers。他的核心观点不是“AI 会杀死 SaaS”,而是 AI 会让软件数量暴增,真正可靠、可维护、能融入工作流的软件公司反而有更大的市场。
他的经验很具体:vibe coding 一个初版很爽,但持续维护、升级、保证它每天都能用,是另一回事。这也是为什么他现在买的软件比以前更多,因为很多时候他只想让别人替他稳定运营那个能力。
Figma 的 AI 方向也很清楚:不要只把 AI 困在文本框里。设计本来就有发散和收敛两个阶段,Infinite Canvas 更适合让 agent 帮你生成多种方向,再让人类精修细节。
更长期的瓶颈会从“生成”转向“审查”:当 agent 能产生大量页面、PR 和设计,人类如何高效判断它是否符合公司的价值和标准,才是下一阶段的问题。
Ryo Lu 展示了 Cursor Composer 2.5 里的设计体验:在代码中设计可以通过 click、chat、按住 shift 多选来完成。
这是一条小信号,但方向清楚:设计工具、代码编辑器和 agent 界面的边界正在继续靠近。
Box CEO Aaron Levie 反过来用 AI coding 来说明知识工作的自动化难度。
写代码已经是最适合 AI 自动化的领域之一:训练数据丰富,用户懂技术,结果可测试,上下文多在代码库里。但即便如此,人类工程师仍然需要监督 agents。
这说明知识工作的自动化可能比外界想象得更复杂。很多知识工作难验证、上下文不完整、评审成本高,所以不能简单套用 AI coding 的速度曲线。
有 2 个播客条目的转录抓取失败,因此没有纳入摘要: