一天顶半年:Cosmos如何把AI科学家推向现实

AI PM 编辑部 · 2025年11月18日 · 11 阅读 · AI/人工智能

正在加载视频...

视频章节

一款名为Cosmos的“AI科学家”引爆了AI圈:一天完成相当于博士半年工作的研究,并已产出7项科学发现。本文基于原视频,拆解它为何引发Sam Altman关注、它究竟做了什么、技术路线的真实含义,以及为什么现在既值得兴奋,也必须保持高度怀疑。

一天顶半年:Cosmos如何把AI科学家推向现实

一款名为Cosmos的“AI科学家”引爆了AI圈:一天完成相当于博士半年工作的研究,并已产出7项科学发现。本文基于原视频,拆解它为何引发Sam Altman关注、它究竟做了什么、技术路线的真实含义,以及为什么现在既值得兴奋,也必须保持高度怀疑。

为什么整个AI圈都在讨论Cosmos?

理解Cosmos的意义,必须先理解一个长期被反复提及的AI愿景:让AI直接参与、甚至主导科学发现。这不是突然冒出来的概念,而是Sam Altman多年来最执着的方向之一。视频中提到,Altman早在2025年6月的文章《The Gentle Singularity》中就写道:“我们已经听到科学家说,他们的生产力比AI出现前提高了两到三倍。”他在后续采访中更明确地给出AGI的判断标准——“当AI能够带来全新的发现”。

正是在这样的背景下,Cosmos的出现显得格外刺眼。它并非来自OpenAI,而是来自一家名为Edison Scientific的公司,但Altman本人在X上公开转发并评论:“This is exciting. I expect we're going to see a lot more things like this and it will be one of the most important aspects of AI.”这相当于一次高度背书。视频主持人也坦言,在大家焦急等待Gemini 3的同时,Cosmos成了社区里真正的焦点。

更重要的是,这不是一个“未来概念演示”,而是一个已经被学术测试者实际使用的系统。它声称已经在神经科学、材料科学和临床遗传学等领域,与学术beta用户合作完成了7项发现。这让讨论从“AI能不能做科研”,迅速变成了“AI已经在做科研了,而且速度惊人”。

一天读1500篇论文:Cosmos到底做了什么?

Cosmos最吸引眼球的,是一组极其具体、也极其激进的数字。Edison Scientific的CEO Sam Rodriguez在X上写道:“Users estimate Cosmos does 6 months of work in a single day.”一次运行,Cosmos可以阅读1500篇论文,生成约42,000行代码,并且其79%的研究结论具备可重复性。

更关键的是,它并不是只做综述或假设生成,而是直接给出了可验证的研究结果。视频详细列举了7项发现,其中3项是对人类科学家尚未发表成果的独立复现。例如,在代谢组学数据中,Cosmos独立识别出低温小鼠大脑中核苷酸代谢是主要改变通路;在钙钛矿太阳能电池研究中,它确认了热处理过程中的湿度是性能成败的关键,并找到了一个“致命阈值”。

剩下4项被公司定义为“新的科学贡献”。包括:发现SOD2酶水平升高可能减少人类心脏组织损伤;提出某一基因变体降低2型糖尿病风险的分子机制;以及两项与阿尔茨海默病相关的新分析方法和神经元脆弱性发现。主持人很坦率地说:“我不是这些领域的科学家,无法判断这些发现有多重要。”但他也强调,一旦公开,真正的考验将来自领域内研究者的独立验证。

所谓“世界模型”,究竟新在哪里?

Cosmos之所以敢宣称“六个月工作量”,核心在于它的架构设计。Rodriguez承认,这个数字“明显高于其他AI实验室(如METR)对AI Agent任务时长的估计”。他们给出的解释是:Cosmos使用了一个“结构化、持续更新的世界模型”。

这里的“世界模型”并非物理仿真意义上的环境模型,而更像一个共享的、不断扩展的知识结构。视频中引用了多位研究者的解读:Cosmos可以被理解为一个“巨大的、实时更新的白板”。数百个AI Agent并行工作——166个负责数据分析,36个负责文献阅读——所有信息都汇入同一个世界模型中,从而保持长期目标的一致性。

一次完整运行最长可达12小时,期间执行多达42,000行代码。这种设计的真正突破不在单个模型有多聪明,而在于它把科研流程拆解成一系列可自动化步骤,并用共享记忆将它们重新编排。正如Nico McCarty所说,科学研究本身是有流程的,而Cosmos正是在流程层面实现了规模化自动化。

六个月一天完成?怀疑与兴奋并存

视频最成熟的部分,并不是赞美,而是克制。Cosmos团队自己就承认,这个系统并不“即插即用”。一次运行价格高达200美元,而且它有可能追逐“统计上显著但科学上无关”的结果。这也引出了一个重要分歧:科研人员究竟是想要高度自主的长时间运行,还是更偏好频繁互动、快速迭代?

关于“六个月”的估算,本身也极具争议。这个数字来自7位beta科学家的主观评估,平均为6.14个月。Nico直接质疑了其中对阅读速度和研究效率的假设,认为人类时间估算本身就不可靠。Cosmos团队部分同意这一点,但反驳称:独立复现未发表成果,以及多位研究者给出相近估算,至少说明这不是空谈。

最有感染力的故事,来自计算生物学家Zachary Flamholtz。他在使用Cosmos后表示,自己被其“结构化的发现报告”和对研究问题的深度理解震撼,并直言这让他“重新想象了自己的职业生涯”。他甚至预测,科学界会记住“2025年11月5日”这个时间点。

总结

Cosmos是否真的等同于“六个月的人类科研工作”,还有待时间和同行评审来回答。但这个视频清楚地展示了一件事:AI参与科学发现,已经从愿景进入了实践阶段。真正的分水岭不在于某个数字是否精确,而在于科研流程本身正在被重构。对研究者而言,最重要的能力,或许正如主持人所说——在极度令人兴奋的同时,保持默认的高度怀疑。


关键词: Cosmos, AI科学家, 世界模型, AI Agent, 科学发现

事实核查备注: 关键事实包括:Cosmos来自Edison Scientific;CEO为Sam Rodriguez;一次运行可读1500篇论文、生成约42,000行代码、最长12小时;79%的发现可复现;共7项发现,其中3项为独立复现、4项为新贡献;一次运行价格200美元;Sam Altman在X上公开评论支持;相关话题包括世界模型、AI Agent、大语言模型。