临床试验8年缩到几分钟?Genmab在OpenAI DevDay展示了AI Agent的真威力
在OpenAI DevDay的舞台上,Genmab抛出了一个让所有AI从业者竖起耳朵的说法:不是99%,而是100%准确率,AI才能真正进入临床试验核心流程。他们展示的不是Demo,而是一套已经把“小时级工作压缩到分钟级”的AI Agent框架。
在OpenAI DevDay的舞台上,Genmab抛出了一个让所有AI从业者竖起耳朵的说法:不是99%,而是100%准确率,AI才能真正进入临床试验核心流程。他们展示的不是Demo,而是一套已经把“小时级工作压缩到分钟级”的AI Agent框架。
在 OpenAI DevDay 的舞台上,Genmab 抛出了一个让全场安静下来的观点:在临床试验里,99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架,如何把原本需要数小时的人类专业工作,压缩到几分钟完成,而且目标只有一个——100% 可用于监管提交。
如果AI Agent不是帮你跑5分钟任务,而是能连续“活”上一周,会发生什么?在OpenAI DevDay上,Altera给出了一个让全场安静的答案:AI会自发形成宗教、经济、协作与长期目标。这不是科幻,而是一次对Agent致命缺陷的正面挑战。
这是一条信息密度极高的AI时间线:OpenAI的Sora终于逼近发布,xAI突然放出几乎无护栏的图像模型Aurora,Meta则用Llama 3.3证明“更小、更便宜”正在改变游戏规则。本文带你还原这三条战线背后的真实信号与行业走向。
在被认为“错过一代大模型”之后,Amazon于AWS re:Invent发布Nova模型家族,正式回到基础模型正面竞争。这不仅是一次产品发布,更是一次价格战、基础设施与战略耐心的集中展示。
很多人还在纠结提示词工程,但真正拉开AI应用差距的,其实是RAG。这门由 Mckay Wrigley 讲授的课程,用一个完整真实项目证明:不懂RAG,你的AI永远只是在“表演智能”。
这期《The AI Daily Brief》用一连串产品更新,勾勒出一个清晰趋势:对话式AI Agent正在从概念走向基础设施。无论是ElevenLabs下场做完整Agent管线,还是Mistral补齐多模态与工作流能力,都在指向同一个信号——AI Agent不再是噱头,而是新一代应用的默认形态。
OpenAI 的 o1 模型被“短暂放出”,200K 上下文窗口、极快推理速度引发热议。但这期 AI Daily Brief 真正重要的,不只是模型本身,而是从企业落地、算力瓶颈到能源与监管,勾勒出一条正在全面加速的 AI 现实曲线。
一段看似平淡的AI新闻速读,透露出一个危险而清晰的信号:英伟达正在从“算力之王”升级为“全栈AI玩家”。从开源模型击穿GPT-4级基准,到数据中心、光子互连的底层革命,这期视频勾勒出AI权力结构正在发生的深层变化。
传了大半年的 OpenAI「Strawberry」终于要来了,但第一批体验者的反馈却异常克制:它会“先想 20 秒再回答”,答案却只好一点点。这不是一次简单的模型升级,而可能是 OpenAI 在竞争压力下的一次战略试探。