← back to archive

2026-05-11 / Codex 采用度、Singapore 与 agent 指标

以下内容来自今日建造者在 X/Twitter 的公开发言,以及新播客节目。

归档日期05-11
会话时间09:01
建造者11
播客1

Podcast Digest

1 / archived items
Podcast · Long-form

Training Data|《ElevenLabs' Mati Staniszewski: How Voice Becomes the Interface for Everything》

archive

这期围绕 ElevenLabs 联合创始人 Mati Staniszewski 展开。按转录内容看,最值得记住的主线有三条:第一,ElevenLabs 的起点来自波兰配音体验很差这一现实问题,因此他们一开始就把“保留情绪和语调的跨语言语音”当成长期方向;第二,他们认为 audio 在 2022 年仍是被低估的赛道,模型更小、算力需求相对不同,因此可以用更聚焦的团队切进去并快速商业化;第三,语音的终局不只是 TTS,而是从转录、翻译、配音到实时 voice agent 的整条链路,未来 voice 会成为人与设备、甚至人与 agent 互动的主要接口之一。节目里还提到一些更具体的判断,比如小团队扁平管理、让非技术团队也嵌入工程能力,以及 voice agent 在客服之外,正在向销售、政务、教育与医疗等场景延展。

X / Twitter Builders

11 archived items
X / Twitter

Aaron Levie

archive

他的核心判断是,agent 会显著降低进入复杂领域的门槛,但真正有经验的人反而会因为判断力、历史语境和纠错能力而更有优势。换句话说,AI 会扩大参与面,也会继续放大专家产出,而不是简单抹平差距。

(Box CEO)

X / Twitter

Zara Zhang

archive

她的观点很鲜明:在 AI 负责“操作”的时代,输出格式应该从方便人工编辑,转向更适合人类消费;因此 HTML 这类可视化、可交互的产物会比纯文本更重要。