一句话查全公司数据:Dust把Text-to-SQL玩成了“自然语言BI”
在 OpenAI DevDay 的一个并不起眼的社区演讲里,Dust 展示了一件让很多数据团队“后背一凉”的事:不用写 SQL、不用建 Dashboard,只靠一句自然语言,就能跨 Snowflake、Google Sheet、CSV 做复杂分析和可视化。这不是玩具 Demo,而是一整套已经跑在真实业务里的“自然语言 BI”。
在 OpenAI DevDay 的一个并不起眼的社区演讲里,Dust 展示了一件让很多数据团队“后背一凉”的事:不用写 SQL、不用建 Dashboard,只靠一句自然语言,就能跨 Snowflake、Google Sheet、CSV 做复杂分析和可视化。这不是玩具 Demo,而是一整套已经跑在真实业务里的“自然语言 BI”。
在OpenAI DevDay的舞台上,Genmab抛出了一个让所有AI从业者竖起耳朵的说法:不是99%,而是100%准确率,AI才能真正进入临床试验核心流程。他们展示的不是Demo,而是一套已经把“小时级工作压缩到分钟级”的AI Agent框架。
在 OpenAI DevDay 2024 上,Mindtrip 的分享意外成了全场最“清醒”的一段:他们几乎没讲 Realtime API,也没炫技模型能力,而是用一个旅行产品,直接点破了当下多模态 AI 最大的幻觉——会看、会听、会说,远远不等于有用。
在 OpenAI DevDay 的舞台上,Genmab 抛出了一个让全场安静下来的观点:在临床试验里,99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架,如何把原本需要数小时的人类专业工作,压缩到几分钟完成,而且目标只有一个——100% 可用于监管提交。
在人道救援领域,完美的数据从来不存在。OpenAI DevDay 上,DataKind 抛出一个反直觉结论:只要把数据“做得比错的多”,AI 就能真正救命。这不是炫技,而是一套被成本、速度和现实约束逼出来的生成式 AI 落地方法论。
如果AI Agent不是帮你跑5分钟任务,而是能连续“活”上一周,会发生什么?在OpenAI DevDay上,Altera给出了一个让全场安静的答案:AI会自发形成宗教、经济、协作与长期目标。这不是科幻,而是一次对Agent致命缺陷的正面挑战。
在 OpenAI DevDay 的舞台上,Tortus 团队抛出一个刺痛行业的事实:在医疗场景里,LLM 最大的风险不是不够聪明,而是“看起来太聪明”。一次无意的幻觉,可能直接影响患者决策。这不是一场炫技分享,而是一堂关于如何把大模型真正送进生产、还不伤人的硬核课。
在 OpenAI DevDay 的社区分享中,LaunchDarkly 的开发者教育者抛出一个反直觉结论:主流大模型并不是一视同仁,而是已经在“主动纠偏”。更意外的是,真正有效的反偏见提示工程,并不复杂,甚至有点“反直觉地朴素”。
在OpenAI DevDay 2024上,VEED的创始人讲了一个反直觉的增长故事:不把用户带到自己的网站,反而让产品爆火。更意外的是,这个决定让他们的AI视频应用成为GPT Store排名第一,每月生成50万条视频。
在 OpenAI DevDay 的舞台上,Sierra 抛出一个让所有 AI Agent 团队不太舒服的事实:你的智能体“看起来能跑”,并不等于“真的可靠”。TAU-bench 用一种近乎残酷的方式证明——只跑一次评测,几乎毫无意义。