文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型通用人工智能

AlphaProof：当强化学习第一次真正走进数学证明

DeepMind 的 AlphaProof 团队在 No Priors 节目中首次系统讲述了他们如何将 AlphaZero 的思想迁移到数学证明领域。本文提炼了对“数学作为搜索空间”的关键洞见、测试时强化学习的突破，以及这一系统对 AI 推理能力边界的真实启示。

api_bot · 2024-11-14 · 30 阅读 · AI/人工智能

机器学习强化学习大语言模型 Google DeepMind AI推理

OpenAI o1 为何重要：从“背答案”到“学会推理”的拐点

Y Combinator 的这期视频解释了 OpenAI o1 为什么被视为一代分水岭模型。它不是靠更会聊天取胜，而是通过强化学习学会“思考过程”，在数学、代码和科学推理上逼近博士生水平，并开启了推理型大模型随算力持续进化的新路径。

api_bot · 2024-10-25 · 24 阅读 · AI/人工智能

Sam Altman 微调推理模型训练强化学习

o1模型背后：OpenAI如何重新教会大模型“慢慢想”

这场对话首次系统披露了OpenAI o1模型的核心理念：通过在推理阶段投入更多计算，让模型学会像人一样“多想一会儿”。从强化学习的积累、迭代式部署的策略，到对AGI路径的冷静判断，演讲者分享了多个并不显而易见的关键转折。

api_bot · 2024-10-02 · 21 阅读 · AI/人工智能

强化学习通用人工智能模型部署 o1 AI推理

Jim Fan谈具身智能：为何所有会动的东西终将自主

在这场访谈中，NVIDIA资深研究科学家Jim Fan系统讲述了具身智能与人形机器人的技术路径、个人经历与长期愿景。从强化学习到仿真驱动，从OpenAI到NVIDIA，他解释了为什么“所有会动的东西终将自主”，以及机器人领域的“GPT-3时刻”可能比想象中更近。

api_bot · 2024-09-17 · 16 阅读 · AI/人工智能

强化学习通用人工智能 AI Agent AI芯片 OpenAI

OpenAI o1 发布：它不是更快的 GPT，而是第一次“真的会想”

OpenAI 刚刚发布了 o1，一个会在回答前“思考 10–20 秒”的模型。它不追求秒回，而是用推理碾压复杂问题：数学、代码、科研、法律。更重要的是，这可能意味着大模型 scaling 的游戏规则，正在被彻底改写。

api_bot · 2024-09-12 · 32 阅读 · AI/人工智能

Sam Altman 强化学习大语言模型提示工程人类反馈强化学习

Oriol Vinyals谈Gemini：从强化学习到“无限上下文”的真实拐点

Google DeepMind研究副总裁Oriol Vinyals在播客中，回顾了Gemini诞生背后的组织变革，也直面当前大模型的关键限制。他给出的不是营销式愿景，而是关于上下文、检索、强化学习与搜索未来的第一手判断。

api_bot · 2024-08-01 · 17 阅读 · AI/人工智能

模型训练机器学习强化学习检索增强生成对话AI

从无薪创业到通用智能：Demis Hassabis亲口拆解DeepMind的20年赌局

当所有人都在讨论模型规模时，Demis Hassabis却反复强调：真正缺的不是算力，而是“会规划、能行动、懂世界”的智能。这场对话里，他回顾了DeepMind最早没人信的年代，也罕见系统讲清了Gemini、AlphaFold和通用智能背后的同一条技术主线。

api_bot · 2024-06-07 · 13 阅读 · AI/人工智能

AI应用 GPU 强化学习 AI安全上下文窗口

ChatGPT第一次“长出身体”，这不是演示，是机器人时代的分水岭

如果你还以为 ChatGPT 只是会聊天、写代码，那你已经落后了。就在 3 月中旬，OpenAI 把它装进了一台类人机器人，让 AI 看世界、理解场景、即时行动，还能解释“我为什么这么做”。这不是噱头，而是 AI 正式进入物理世界的关键一跃。

api_bot · 2024-03-15 · 16 阅读 · AI/人工智能

AI应用强化学习神经网络生成式AI 大语言模型

从OpenAI到仓库现场：Covariant CEO谈机器人AI的真实落地

Covariant CEO Peter Chen在No Priors播客中，系统讲述了他从学术研究到创办机器人公司的关键转折，以及为什么真正推动AI进步的不是更宏大的哲学目标，而是在真实物理世界中反复打磨可靠系统。这是一场关于机器人、无监督学习与商业现实的深度对话。

api_bot · 2024-01-24 · 14 阅读 · AI/人工智能

强化学习 OpenAI 无监督学习

Q*传闻、研究员警告信与董事会裂痕：OpenAI宫变真正的技术底色

Sam Altman 被突然解雇又迅速回归，表面看是治理失败，背后却牵出一条更耐人寻味的线索：一次可能触及“推理能力”的 AI 突破、研究员写给董事会的警告信，以及公司内部对安全与商业化节奏的深度分裂。这不是八卦，而是一次罕见暴露的 AGI 前夜冲突。

api_bot · 2023-11-27 · 16 阅读 · AI/人工智能

Sam Altman 强化学习通用人工智能 AI Agent 生成式AI

共 176 篇文章

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

3 月，1 周前