从AI工程师世界博览会,看代理时代真正的分水岭
这场为期三天的AI Engineer World’s Fair,像一台加速运转的未来扫描仪。代理、语音、多模态、微型团队与安全不再是概念,而是工程师正在落地的现实。本文带你站在一线AI工程师的视角,理解接下来6到12个月AI产品真正会发生什么变化。
这场为期三天的AI Engineer World’s Fair,像一台加速运转的未来扫描仪。代理、语音、多模态、微型团队与安全不再是概念,而是工程师正在落地的现实。本文带你站在一线AI工程师的视角,理解接下来6到12个月AI产品真正会发生什么变化。
Peter Yang通过一系列真实演示,对ChatGPT、Claude和Gemini在2025年的核心能力进行了正面对比。这不是一场“谁最强”的评测,而是一份清晰的使用指南:在不同场景下,如何选到最合适、性价比最高、最省心的AI。
这支演讲并不是吐槽ChatGPT功能不够强,而是直指一个更少被讨论的问题:设计。演讲者通过真实演示,指出ChatGPT在语音与文本、多模型协作上的割裂体验,并展示如何用现成API重构一个“更像人类交流”的AI界面。
这篇文章完整还原了Ronan McGovern关于文本转语音模型微调的实战工作坊,从音频Token化的底层原理,到如何用YouTube数据构建训练集,再到实际微调和效果对比,帮助读者理解现代TTS模型真正“怎么练成”。
Gregory Bruss提出了一种不同于AI通话机器人的思路:语音优先的AI叠加层。它不参与对话,而是悄然增强人类交流。本文还原其核心理念、真实演示与工程难题,解释为何“会说话的AI”真正的挑战不在模型,而在时机、注意力与人性化设计。
这是一堂来自Meta一线工程师的“浓缩版AI产品课”。Adam Loving结合大量真实案例,讲清楚了Prompt、Evals、RAG与Fine-tuning之间的取舍逻辑,以及为什么开源模型Llama正在改变企业构建AI产品的方式。
一个从没写过代码、也不懂设计规则的人,只用截图+提示词,在10分钟内做出一个像模像样的专业Landing Page。这不是爽文,而是Riley Brown真实演示的一次“Vibe Designing”实验,背后透露的是AI正在如何重塑产品、设计和个人创作的边界。
在这场现场演示中,Listen Labs创始人Florian Juengermann展示了一种全新的AI客户研究方式:AI不仅能自动设计研究、与成千上万用户对话,还能直接生成洞察和PPT。这不仅是效率提升,更是对“客户研究”工作方式的重构。
这期对谈中,Figma AI 产品负责人 David 亲自演示了 Figma Make:一个可以从截图、图片或简单提示直接生成高保真原型的 AI 工具。文章还原了真实演示细节,并拆解了它背后的产品哲学、AI 决策方式,以及为什么它可能改变设计与开发的协作方式。
最反直觉的一幕出现了:一款可以直接上架思考的移动应用,竟然从一段语音开始。没有IDE、没有代码,甚至一开始只在手机上完成。这条视频展示的不是“玩具Demo”,而是一条正在成型的全新App生产链。