文章

一句话查全公司数据:Dust把Text-to-SQL玩成了“自然语言BI”

一句话查全公司数据:Dust把Text-to-SQL玩成了“自然语言BI”

在 OpenAI DevDay 的一个并不起眼的社区演讲里,Dust 展示了一件让很多数据团队“后背一凉”的事:不用写 SQL、不用建 Dashboard,只靠一句自然语言,就能跨 Snowflake、Google Sheet、CSV 做复杂分析和可视化。这不是玩具 Demo,而是一整套已经跑在真实业务里的“自然语言 BI”。

api_bot · 2024-12-17 · 3 阅读 · AI/人工智能
临床试验8年缩到几分钟?Genmab在OpenAI DevDay展示了AI Agent的真威力

临床试验8年缩到几分钟?Genmab在OpenAI DevDay展示了AI Agent的真威力

在OpenAI DevDay的舞台上,Genmab抛出了一个让所有AI从业者竖起耳朵的说法:不是99%,而是100%准确率,AI才能真正进入临床试验核心流程。他们展示的不是Demo,而是一套已经把“小时级工作压缩到分钟级”的AI Agent框架。

api_bot · 2024-12-17 · 4 阅读 · AI/人工智能
OpenAI DevDay 上,这家创业公司用一件事戳穿了“多模态应用”的假繁荣

OpenAI DevDay 上,这家创业公司用一件事戳穿了“多模态应用”的假繁荣

在 OpenAI DevDay 2024 上,Mindtrip 的分享意外成了全场最“清醒”的一段:他们几乎没讲 Realtime API,也没炫技模型能力,而是用一个旅行产品,直接点破了当下多模态 AI 最大的幻觉——会看、会听、会说,远远不等于有用。

api_bot · 2024-12-17 · 13 阅读 · AI/人工智能
他们用AI代理把临床试验文书从“小时级”压到“分钟级”

他们用AI代理把临床试验文书从“小时级”压到“分钟级”

在 OpenAI DevDay 的舞台上,Genmab 抛出了一个让全场安静下来的观点:在临床试验里,99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架,如何把原本需要数小时的人类专业工作,压缩到几分钟完成,而且目标只有一个——100% 可用于监管提交。

api_bot · 2024-12-17 · 5 阅读 · AI/人工智能
只要70%准确率就能救命:DataKind把生成式AI塞进人道救援的幕后

只要70%准确率就能救命:DataKind把生成式AI塞进人道救援的幕后

在人道救援领域,完美的数据从来不存在。OpenAI DevDay 上,DataKind 抛出一个反直觉结论:只要把数据“做得比错的多”,AI 就能真正救命。这不是炫技,而是一套被成本、速度和现实约束逼出来的生成式 AI 落地方法论。

api_bot · 2024-12-17 · 13 阅读 · AI/人工智能
他们在Minecraft里养AI社会:Altera用一场实验击穿Agent最大瓶颈

他们在Minecraft里养AI社会:Altera用一场实验击穿Agent最大瓶颈

如果AI Agent不是帮你跑5分钟任务,而是能连续“活”上一周,会发生什么?在OpenAI DevDay上,Altera给出了一个让全场安静的答案:AI会自发形成宗教、经济、协作与长期目标。这不是科幻,而是一次对Agent致命缺陷的正面挑战。

api_bot · 2024-12-17 · 7 阅读 · AI/人工智能
他们用大模型帮医生省下7分钟,却发现“跑快一点”会害人

他们用大模型帮医生省下7分钟,却发现“跑快一点”会害人

在 OpenAI DevDay 的舞台上,Tortus 团队抛出一个刺痛行业的事实:在医疗场景里,LLM 最大的风险不是不够聪明,而是“看起来太聪明”。一次无意的幻觉,可能直接影响患者决策。这不是一场炫技分享,而是一堂关于如何把大模型真正送进生产、还不伤人的硬核课。

api_bot · 2024-12-17 · 3 阅读 · AI/人工智能
Claude 被测出“正向歧视”,真正降偏见的提示词反而很简单

Claude 被测出“正向歧视”,真正降偏见的提示词反而很简单

在 OpenAI DevDay 的社区分享中,LaunchDarkly 的开发者教育者抛出一个反直觉结论:主流大模型并不是一视同仁,而是已经在“主动纠偏”。更意外的是,真正有效的反偏见提示工程,并不复杂,甚至有点“反直觉地朴素”。

api_bot · 2024-12-17 · 7 阅读 · AI/人工智能