一天顶半年：Cosmos如何把AI科学家推向现实

AI PM 编辑部 · 2025年11月18日 · 11 阅读 · AI/人工智能

Sam Altman 上下文窗口世界模型通用人工智能代码生成 AI应用 AI Agent 大语言模型 Gemini OpenAI

正在加载视频...

视频章节

一款名为Cosmos的“AI科学家”引爆了AI圈：一天完成相当于博士半年工作的研究，并已产出7项科学发现。本文基于原视频，拆解它为何引发Sam Altman关注、它究竟做了什么、技术路线的真实含义，以及为什么现在既值得兴奋，也必须保持高度怀疑。

一天顶半年：Cosmos如何把AI科学家推向现实

一款名为Cosmos的“AI科学家”引爆了AI圈：一天完成相当于博士半年工作的研究，并已产出7项科学发现。本文基于原视频，拆解它为何引发Sam Altman关注、它究竟做了什么、技术路线的真实含义，以及为什么现在既值得兴奋，也必须保持高度怀疑。

为什么整个AI圈都在讨论Cosmos？

理解Cosmos的意义，必须先理解一个长期被反复提及的AI愿景：让AI直接参与、甚至主导科学发现。这不是突然冒出来的概念，而是Sam Altman多年来最执着的方向之一。视频中提到，Altman早在2025年6月的文章《The Gentle Singularity》中就写道：“我们已经听到科学家说，他们的生产力比AI出现前提高了两到三倍。”他在后续采访中更明确地给出AGI的判断标准——“当AI能够带来全新的发现”。

正是在这样的背景下，Cosmos的出现显得格外刺眼。它并非来自OpenAI，而是来自一家名为Edison Scientific的公司，但Altman本人在X上公开转发并评论：“This is exciting. I expect we're going to see a lot more things like this and it will be one of the most important aspects of AI.”这相当于一次高度背书。视频主持人也坦言，在大家焦急等待Gemini 3的同时，Cosmos成了社区里真正的焦点。

更重要的是，这不是一个“未来概念演示”，而是一个已经被学术测试者实际使用的系统。它声称已经在神经科学、材料科学和临床遗传学等领域，与学术beta用户合作完成了7项发现。这让讨论从“AI能不能做科研”，迅速变成了“AI已经在做科研了，而且速度惊人”。

一天读1500篇论文：Cosmos到底做了什么？

Cosmos最吸引眼球的，是一组极其具体、也极其激进的数字。Edison Scientific的CEO Sam Rodriguez在X上写道：“Users estimate Cosmos does 6 months of work in a single day.”一次运行，Cosmos可以阅读1500篇论文，生成约42，000行代码，并且其79%的研究结论具备可重复性。

更关键的是，它并不是只做综述或假设生成，而是直接给出了可验证的研究结果。视频详细列举了7项发现，其中3项是对人类科学家尚未发表成果的独立复现。例如，在代谢组学数据中，Cosmos独立识别出低温小鼠大脑中核苷酸代谢是主要改变通路；在钙钛矿太阳能电池研究中，它确认了热处理过程中的湿度是性能成败的关键，并找到了一个“致命阈值”。

剩下4项被公司定义为“新的科学贡献”。包括：发现SOD2酶水平升高可能减少人类心脏组织损伤；提出某一基因变体降低2型糖尿病风险的分子机制；以及两项与阿尔茨海默病相关的新分析方法和神经元脆弱性发现。主持人很坦率地说：“我不是这些领域的科学家，无法判断这些发现有多重要。”但他也强调，一旦公开，真正的考验将来自领域内研究者的独立验证。

所谓“世界模型”，究竟新在哪里？

Cosmos之所以敢宣称“六个月工作量”，核心在于它的架构设计。Rodriguez承认，这个数字“明显高于其他AI实验室（如METR）对AI Agent任务时长的估计”。他们给出的解释是：Cosmos使用了一个“结构化、持续更新的世界模型”。

这里的“世界模型”并非物理仿真意义上的环境模型，而更像一个共享的、不断扩展的知识结构。视频中引用了多位研究者的解读：Cosmos可以被理解为一个“巨大的、实时更新的白板”。数百个AI Agent并行工作——166个负责数据分析，36个负责文献阅读——所有信息都汇入同一个世界模型中，从而保持长期目标的一致性。

一次完整运行最长可达12小时，期间执行多达42，000行代码。这种设计的真正突破不在单个模型有多聪明，而在于它把科研流程拆解成一系列可自动化步骤，并用共享记忆将它们重新编排。正如Nico McCarty所说，科学研究本身是有流程的，而Cosmos正是在流程层面实现了规模化自动化。

六个月一天完成？怀疑与兴奋并存

视频最成熟的部分，并不是赞美，而是克制。Cosmos团队自己就承认，这个系统并不“即插即用”。一次运行价格高达200美元，而且它有可能追逐“统计上显著但科学上无关”的结果。这也引出了一个重要分歧：科研人员究竟是想要高度自主的长时间运行，还是更偏好频繁互动、快速迭代？

关于“六个月”的估算，本身也极具争议。这个数字来自7位beta科学家的主观评估，平均为6.14个月。Nico直接质疑了其中对阅读速度和研究效率的假设，认为人类时间估算本身就不可靠。Cosmos团队部分同意这一点，但反驳称：独立复现未发表成果，以及多位研究者给出相近估算，至少说明这不是空谈。

最有感染力的故事，来自计算生物学家Zachary Flamholtz。他在使用Cosmos后表示，自己被其“结构化的发现报告”和对研究问题的深度理解震撼，并直言这让他“重新想象了自己的职业生涯”。他甚至预测，科学界会记住“2025年11月5日”这个时间点。

总结

Cosmos是否真的等同于“六个月的人类科研工作”，还有待时间和同行评审来回答。但这个视频清楚地展示了一件事：AI参与科学发现，已经从愿景进入了实践阶段。真正的分水岭不在于某个数字是否精确，而在于科研流程本身正在被重构。对研究者而言，最重要的能力，或许正如主持人所说——在极度令人兴奋的同时，保持默认的高度怀疑。

关键词： Cosmos， AI科学家，世界模型， AI Agent，科学发现

事实核查备注：关键事实包括：Cosmos来自Edison Scientific；CEO为Sam Rodriguez；一次运行可读1500篇论文、生成约42，000行代码、最长12小时；79%的发现可复现；共7项发现，其中3项为独立复现、4项为新贡献；一次运行价格200美元；Sam Altman在X上公开评论支持；相关话题包括世界模型、AI Agent、大语言模型。

返回文章列表