他们用AI代理把临床试验文书从“小时级”压到“分钟级”
在 OpenAI DevDay 的舞台上,Genmab 抛出了一个让全场安静下来的观点:在临床试验里,99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架,如何把原本需要数小时的人类专业工作,压缩到几分钟完成,而且目标只有一个——100% 可用于监管提交。
在 OpenAI DevDay 的舞台上,Genmab 抛出了一个让全场安静下来的观点:在临床试验里,99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架,如何把原本需要数小时的人类专业工作,压缩到几分钟完成,而且目标只有一个——100% 可用于监管提交。
如果AI Agent不是帮你跑5分钟任务,而是能连续“活”上一周,会发生什么?在OpenAI DevDay上,Altera给出了一个让全场安静的答案:AI会自发形成宗教、经济、协作与长期目标。这不是科幻,而是一次对Agent致命缺陷的正面挑战。
这是一条信息密度极高的AI时间线:OpenAI的Sora终于逼近发布,xAI突然放出几乎无护栏的图像模型Aurora,Meta则用Llama 3.3证明“更小、更便宜”正在改变游戏规则。本文带你还原这三条战线背后的真实信号与行业走向。
在被认为“错过一代大模型”之后,Amazon于AWS re:Invent发布Nova模型家族,正式回到基础模型正面竞争。这不仅是一次产品发布,更是一次价格战、基础设施与战略耐心的集中展示。
很多人还在纠结提示词工程,但真正拉开AI应用差距的,其实是RAG。这门由 Mckay Wrigley 讲授的课程,用一个完整真实项目证明:不懂RAG,你的AI永远只是在“表演智能”。
这期《The AI Daily Brief》用一连串产品更新,勾勒出一个清晰趋势:对话式AI Agent正在从概念走向基础设施。无论是ElevenLabs下场做完整Agent管线,还是Mistral补齐多模态与工作流能力,都在指向同一个信号——AI Agent不再是噱头,而是新一代应用的默认形态。
OpenAI 的 o1 模型被“短暂放出”,200K 上下文窗口、极快推理速度引发热议。但这期 AI Daily Brief 真正重要的,不只是模型本身,而是从企业落地、算力瓶颈到能源与监管,勾勒出一条正在全面加速的 AI 现实曲线。
一段看似平淡的AI新闻速读,透露出一个危险而清晰的信号:英伟达正在从“算力之王”升级为“全栈AI玩家”。从开源模型击穿GPT-4级基准,到数据中心、光子互连的底层革命,这期视频勾勒出AI权力结构正在发生的深层变化。
传了大半年的 OpenAI「Strawberry」终于要来了,但第一批体验者的反馈却异常克制:它会“先想 20 秒再回答”,答案却只好一点点。这不是一次简单的模型升级,而可能是 OpenAI 在竞争压力下的一次战略试探。
ChatGPT 用9个月时间,把周活用户从1亿拉到2亿。表面看是增长神话,细看却是一场关于“谁在真正用AI”的分水岭:企业、开发者、以及正在被AI重塑的行业,已经悄悄走到了舞台中央。