← back to archive

2026-05-10 / HTML 文档流、token 预算与个人软件

以下内容来自今日收录的建造者 X/Twitter 动态与播客更新。

归档日期05-10
会话时间09:00
建造者9
播客1

Podcast Digest

1 / archived items
Podcast · Long-form

AI & I by Every

archive

《The Secrets of Claude's Platform From the Team Who Built It》 这期内容围绕 Claude 平台的未来方向展开。开场最值得记住的一点是:平台的理想形态,可能不是让用户自己决定该用什么模型、怎么搭 agent 架构,而是让 Claude “足够理解自己”,自动判断该用什么模型、如何拉起 sub-agents,甚至按需“on the fly”生成合适的系统形态。 片段里也明确提到,如果 agent 会动态生成、平台会替用户处理越来越多架构复杂度,那么底层扩展能力就必须同步大幅提升。对普通用户来说,这意味着未来的平台竞争,可能不只是模型能力之争,而是“把复杂性藏起来”的系统工程之争。

X / Twitter Builders

9 archived items
X / Twitter

Thariq(bio 显示

archive

Claude Code @ Anthropic) 他分享了一个很具体的工作流变化:相比 Markdown,他越来越多地直接让 Claude Code 生成 HTML,并直言“HTML is the new markdown”。同一组动态里他还放出了自己生成的示例 HTML 文档,说明这不只是观点,更是已经在实践中的文档产出方式。

X / Twitter

Alex Albert

archive

提供给 METR 的早期 Claude Mythos Preview snapshot,在 80% 成功率基准上的 time horizon 超过下一名模型的 2 倍。重点不在泛泛地说“更强”,而是在特定评测口径下强调持续完成任务能力的明显拉开。

(Research @ Anthropic) 他转发并强调了一个 benchmark 结果

X / Twitter

Aaron Levie

archive

随着 agent 执行更长时任务、消耗更多 compute,企业很快会进入“token budgeting”时代。核心判断是,token 会像人才、营销、设备这些预算项一样被严格分配和审计,而围绕 agent 开销可视化、控制与分账,可能会催生新一代软件机会。

(Box CEO) 他提出了一个很务实的企业 AI 议题

X / Twitter

Matt Turck

archive

定价未必会纯粹走 consumption-based。因为企业级 agent 往往还需要身份、权限、预算、审计日志等能力,这使它们在某些层面上又带有“seat-like”的属性,只是不是传统的人类 seat。

(FirstMark VC,MAD Podcast host) 他对 AI agent 的商业模式提出了一个值得注意的判断

X / Twitter

Zara Zhang 她展示了一个 “YouTube realtime copilot” 浏览器扩展,基于 OpenAI realtime 2 API

archive

agent 能一边陪你看视频,一边通过实时语音回答刚刚讲过的内容。她特别强调,这个系统能区分 YouTube 音频流和用户自己的声音,因此不会把视频内容误识别成指令,只会在你提问时响应。

X / Twitter

Peter Steinberger 他的观点很短,但很有操作感

archive

给 Codex 的 skills 越多,需要写的 prompt 就越少。背后的含义是,能力封装和工作流预置,可能比反复打磨 prompt 更能提升 agent 的实际可用性。

X / Twitter

Amanda Askell(bio 显示

archive

Philosopher & ethicist @ Anthropic) 她谈的是 alignment 的“正面愿景”:研究当然要关注如何避免令人担忧的行为,但更重要的是,也要让模型理解“好的 AI 应该成为什么样、为什么值得那样做”。这条动态的重点不是风险清单,而是对训练目标的积极定义。

X / Twitter

Garry Tan

archive

一方面提出“Personal software is coming”,另一方面对能在 128GB MacBook Pro 上运行、具备 100 万 token context window 且带可用 coding agent 能力的产品表示震撼。整体基调很明确:本地高上下文 agent 正在把个人软件推向新阶段。

(Y Combinator President & CEO) 他连续几条动态都围绕新一代个人 AI 工具展开