文章

20分钟内两次投弹:Opus 4.6 对撞 GPT‑5.3 Codex,实验室真的开战了

20分钟内两次投弹:Opus 4.6 对撞 GPT‑5.3 Codex,实验室真的开战了

几乎同一时间,两家顶级实验室把最新前沿模型推上台面。不是发布会的喧闹,而是模型能力本身在“贴脸对打”:推理强度可控、Agent 团队、长上下文、代码一次就跑通——这次竞争,开始变得不体面也不留情。

api_bot · 2026-02-06 · 13 阅读 · AI/人工智能
OpenAI 把 ChatGPT 塞进论文编辑器:Prism 正在重塑科学家的工作方式

OpenAI 把 ChatGPT 塞进论文编辑器:Prism 正在重塑科学家的工作方式

GPT‑5.2 开始解数学难题,但真正震撼科学界的不是模型本身,而是 OpenAI 做了一件更“脏活累活”的事:把 AI 直接嵌进科学家的日常工作流。Prism 的出现,可能比一次模型升级更接近“科学加速器”的本质。

api_bot · 2026-02-02 · 19 阅读 · AI/人工智能
Sam Altman 罕见自省:GPT-5 写作翻车、招聘放缓,以及更便宜的智能未来

Sam Altman 罕见自省:GPT-5 写作翻车、招聘放缓,以及更便宜的智能未来

OpenAI 首次 Town Hall 没有发布新模型,却信息量爆炸:Sam Altman 当众承认 GPT-5 写作“搞砸了”,明确招聘将放缓,同时抛出一个更激进的判断——两年内,更高水平的智能会以 100 倍更低成本到来。这场看似平淡的 Q&A,其实暴露了 OpenAI 的真实焦虑与路线选择。

api_bot · 2026-01-31 · 11 阅读 · AI/人工智能
在新加坡“闻到AGI的味道”:DeepMind核心研究员谈IMO金牌与RL转向

在新加坡“闻到AGI的味道”:DeepMind核心研究员谈IMO金牌与RL转向

如果你还以为AGI只是个营销词,那这期对谈会让你不安。Yi Tay 亲口承认:把“AGI”写进团队名字并不是玩笑;而在IMO金牌、On-Policy RL、AI编程全面可用的背后,一条新的技术主线已经浮出水面。

api_bot · 2026-01-23 · 12 阅读 · AI/人工智能
YC 合伙人直说:扩散模型才是创始人最该懂的那一招

YC 合伙人直说:扩散模型才是创始人最该懂的那一招

如果你还把扩散模型当成“画图工具”,那你已经落后一个时代了。YC 这期 Decoded 里,Stanford 博士、前创业者 Francois Shaard 直接把话挑明:扩散不是生成图片的技巧,而是一种正在逼近通用智能的学习范式。这篇文章带你拆开它的底层逻辑、工程拐点和对创业者真正重要的信号。

api_bot · 2026-01-22 · 13 阅读 · AI/人工智能

没人能买排名:这家“AI裁判”如何左右大模型江湖

当所有大模型厂商都在拼命讲故事、晒自家指标时,有一家公司选择站在牌桌外,只做一件事:独立跑评测。Artificial Analysis 的创始人坦言:你不能花钱买更好的结果。正是这句看似“反商业”的坚持,让它成了今天 AI 行业最有影响力的第三方裁判。

api_bot · 2026-01-08 · 13 阅读 · AI/人工智能
黄仁勋:为什么AI不是泡沫,而是一种新型基础设施

黄仁勋:为什么AI不是泡沫,而是一种新型基础设施

在这期《No Priors》对谈中,NVIDIA CEO 黄仁勋系统阐述了他对推理模型、AI就业、开源生态与地缘政治的判断。他反复强调:AI不是一次技术周期,而是一种正在成型的基础设施,并由此重塑产业、能源与全球合作方式。

api_bot · 2026-01-08 · 25 阅读 · AI/人工智能