Madhu Guru
宣布将从 Google 离开,并回顾自己先后参与从零搭建 Search & Ads、以及 Gemini 相关业务。他提到,三年前 OpenAI 和 Anthropic 领先,Gemini 团队后来补齐了模型构建方法、客户反馈飞轮和企业业务,认为 Gemini 3 是这些系统真正合流的时刻。
(Google Gemini 产品负责人)
今天的内容来自 AI 建造者在 X/Twitter 的最新发言,以及新一期播客。
更大的模型不一定会自动更安全,安全性和鲁棒性不能指望靠规模自然解决。Zico Kolter 提到,如果某项能力不够好,可以等下一代模型继续提升,但在安全和鲁棒性上,事情并不会这样自动发生;他还强调,现代 AI 系统底层代码本身其实“极其简单”,复杂性更多来自训练数据。结合标题和转录内容,这期更适合关心 AI safety、模型发布治理、jailbreaking 与 prompt injection 风险的人。
宣布将从 Google 离开,并回顾自己先后参与从零搭建 Search & Ads、以及 Gemini 相关业务。他提到,三年前 OpenAI 和 Anthropic 领先,Gemini 团队后来补齐了模型构建方法、客户反馈飞轮和企业业务,认为 Gemini 3 是这些系统真正合流的时刻。
(Google Gemini 产品负责人)
转发并强调一个具体成果:在 Claude Mythos Preview 的帮助下,Firefox 团队 4 月修复的安全漏洞数量,超过了此前 15 个月的总和。这条动态很直接地指向了 AI 在安全工程提效上的现实价值。
(Anthropic 研究员)
分享了一个很实用的判断框架:当 AI 让某件事变得更容易时,不能只看效率提升,还要看“所有人都会一起变快”之后,新的竞争差异会转移到哪里。他的结论是,如果写软件更容易了,资源会更多流向销售、市场和客户成功,其他行业也会出现类似迁移。
(Box CEO)
连续更新了多项 agent 工具进展。包括 GStack v1.28 支持下载、支持在无头 Linux 容器中以 headed 配置模式运行浏览器,并新增 llms.txt 方便各类 agent 使用技能;同时 GBrain 增加 thin-client mode,让 Claude Code 或其他副 agent 不必单独跑自己的 MCP server。
(Y Combinator 总裁兼 CEO)
一条是产品能力层面的更新,提到“Molty 学会委派 cron jobs”,强调 agent 之间开始互相协作;另一条是使用体验层面的反馈,认为 `/goal + GPT 5.5` 已经足够胜任带 e2e tests 的大规模重构规划。两条都在说明 agent 工作流正变得更可用。
一方面表示,AI 更适合把软件开发者“进化成超级个体”,而不是简单替代他们,并强调现在一个真正优秀的人已经能做出非常惊人的成果;另一方面,他还观察到年轻人似乎更偏好用语音与 AI 交互,而中间年龄层更偏向打字。
抛出“AI platform war is coming”的判断,并介绍了一期围绕 xAI 算力交易、managed agents,以及 Anthropic 如何把 API 逐步做成开发者云基础设施的快速讨论。重点是平台竞争正在从模型能力延伸到更完整的开发者栈。
(Every CEO)
用一句非常产品化的话总结了 Cursor 的定位方向:`from idea to merge, all in Cursor`。虽然信息量不大,但核心很明确,就是把从想法到代码合并的整个链路尽量收敛在同一个开发环境里。
(Cursor 设计)
重点推荐了他与 Zico Kolter 的长谈,内容覆盖 OpenAI 董事会与安全委员会如何运作、模型发布审查、前沿模型安全性是否会随规模自然提升、AI agents 带来的攻击面扩大等问题,并附了完整时间轴。
(FirstMark VC,MAD Podcast 主持人)