文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型提示工程

让大模型“迷路”反而更聪明：OpenAI o1 背后的强化学习新范式

让大模型“迷路”反而更聪明：OpenAI o1 背后的强化学习新范式

你可能以为，大语言模型变强靠的是更多数据、更大参数。但这场演讲抛出一个反直觉结论：真正的突破，来自让模型在强化学习环境里“自由游走”。从 OpenAI o1 到可验证的推理环境，LLM 训练正在换一套底层逻辑。

api_bot · 2026-04-08 · 74 阅读 · AI/人工智能

模型训练强化学习大语言模型 OpenAI o1

当机器人“抢工作”：Twilio文档团队的真实AI协作实践

当机器人“抢工作”：Twilio文档团队的真实AI协作实践

在这场来自 AI Engineer 世界博览会的演讲中，Elmer Thomas 和 Maria Bermudez 用一个真实而克制的案例，展示了AI如何不是取代人，而是成为小团队的放大器。他们分享了Twilio文档团队如何用多个单一职责AI Agent，解决高风险、低创造性的工作，并通过严密的护栏机制，把“AI会胡说八道”的风险降到可控范围。

api_bot · 2025-06-03 · 75 阅读 · AI/人工智能

AI应用 AI Agent AI工具幻觉提示工程

从一分钟到八年：OpenAI如何用推理逼近爱因斯坦

从一分钟到八年：OpenAI如何用推理逼近爱因斯坦

OpenAI研究员Dan Roberts用一次极具想象力的演讲，解释了为什么“推理”正在成为AI下一阶段的核心扩展维度。从test-time compute到强化学习主导训练，再到“9年内发现广义相对论”的大胆预测，这场分享揭示了通往AGI的一条非共识路径。

api_bot · 2025-05-08 · 80 阅读 · AI/人工智能

推理模型训练强化学习 AI Agent Yann LeCun

Function Calling 之后，AI Agent 正在悄悄换一条进化路线

Function Calling 之后，AI Agent 正在悄悄换一条进化路线

这是一场由 OpenAI 开发者体验团队成员 Ilan Bigio 主讲的实战型工作坊。它没有炫技式 Demo，而是从函数调用的“原始用法”出发，一步步推演出 Agent、记忆、委托、异步执行，直到对未来“生成代码式 Agent”的判断，勾勒出一条清晰但正在被忽视的技术演进路径。

api_bot · 2025-04-23 · 74 阅读 · AI/人工智能

AI Agent 大语言模型 OpenAI o1

用有限状态机驯服AI代理：一种可治理的多智能体构建范式

用有限状态机驯服AI代理：一种可治理的多智能体构建范式

在Agentic AI成为主流的2025年，真正的难题已不再是模型能力，而是如何让AI系统变得可预测、可审计、可控制。AI Engineer频道的Adam Charlson提出，将有限状态机与Actor模型、LLM结合，或许是一条被低估但极其务实的路径。

api_bot · 2025-02-22 · 109 阅读 · AI/人工智能

微调 AI Agent 检索增强生成 AI伦理大语言模型

OpenAI 扔掉“秒回”：Deep Research 为什么敢让 AI 想30分钟

OpenAI 扔掉“秒回”：Deep Research 为什么敢让 AI 想30分钟

OpenAI 在东京发布了一个反直觉的新能力：AI 不再追求“快”，而是被允许在后台默默思考 5 到 30 分钟。它能自己上网、改计划、写出带引用的研究报告。这不是小功能更新，而是一次对“AI 应该怎么工作”的彻底改写。

api_bot · 2025-02-03 · 68 阅读 · AI/人工智能

微调强化学习通用人工智能 AI Agent 大语言模型

当AI开始“不耐烦”：NotebookLM与多语言思考的意外时刻

当AI开始“不耐烦”：NotebookLM与多语言思考的意外时刻

这期《The AI Daily Brief》展示了两个出人意料却极具启发性的AI故事：Google不得不给NotebookLM的AI播客主持人做“情绪管理”，而OpenAI的o1模型则在推理时突然切换语言。这些看似怪异的现象，实际上揭示了大语言模型在提示工程、训练数据和多语言思维层面的深层逻辑。

api_bot · 2025-01-18 · 64 阅读 · AI/人工智能

模型训练开源模型生成式AI 对话AI 大语言模型

他用 o1 Pro 写代码的方式太狠了：AI 不是帮你写，而是直接进仓库

他用 o1 Pro 写代码的方式太狠了：AI 不是帮你写，而是直接进仓库

大多数人还在把 ChatGPT 当“高级代码补全”，Mckay Wrigley 已经把 o1 Pro 变成了真实项目里的协作者。从提示工程、Repo Prompt 到 Cursor 的 apply 流程，这套工作流的核心不是更聪明的模型，而是让 AI 的代码“立刻可用”。

api_bot · 2024-12-08 · 61 阅读 · AI/人工智能

代码生成 Cursor 提示工程 ChatGPT o1

OpenAI 放出一张王牌：强化微调，让小模型反超大模型

OpenAI 放出一张王牌：强化微调，让小模型反超大模型

OpenAI 在“12 Days of OpenAI”第二天抛出一个狠招：不是更大的模型，而是一种新训练方式，让 o1-mini 在特定任务上干翻 o1。本质不是微调升级，而是把 OpenAI 内部的“强化学习秘密武器”交到开发者手里。

api_bot · 2024-12-06 · 68 阅读 · AI/人工智能

微调模型训练强化学习 AI安全大语言模型

从o1到AGI：Noam Brown谈扩展、经济性与真正的智能边界

从o1到AGI：Noam Brown谈扩展、经济性与真正的智能边界

在o1模型全面发布之际，OpenAI研究负责人Noam Brown回顾了过去三年对AGI时间线的判断变化，系统阐述了他对预训练经济性、扩展路径、多模态模型以及评测方式的核心看法。这是一场关于“什么真的有效”的冷静反思。

api_bot · 2024-12-06 · 62 阅读 · AI/人工智能

通用人工智能多模态预训练 o1

下一页

共 20 篇文章

社群

|

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

4 月，3 周前

🔥 本周热读