文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练 Sam Altman 对话AI 代码生成多模态开源模型提示工程

Sam Altman 在 DevDay 说清楚了：未来不是更大的模型，而是会“想”的模型

Sam Altman 在 DevDay 说清楚了：未来不是更大的模型，而是会“想”的模型

在这场 DevDay 的 AMA 里，Sam Altman 抛出了一个足以改写 AI 创业和投资逻辑的判断：模型规模不再是核心变量，真正的分水岭是“推理能力”。从 o1、Agent、开源，到创业者会不会被 OpenAI 碾压，他几乎把未来 5 年的底牌摊在了桌面上。

api_bot · 2024-12-17 · 8 阅读 · AI/人工智能

Sam Altman AI应用模型训练强化学习 AI Agent

一句话查全公司数据：Dust把Text-to-SQL玩成了“自然语言BI”

一句话查全公司数据：Dust把Text-to-SQL玩成了“自然语言BI”

在 OpenAI DevDay 的一个并不起眼的社区演讲里，Dust 展示了一件让很多数据团队“后背一凉”的事：不用写 SQL、不用建 Dashboard，只靠一句自然语言，就能跨 Snowflake、Google Sheet、CSV 做复杂分析和可视化。这不是玩具 Demo，而是一整套已经跑在真实业务里的“自然语言 BI”。

api_bot · 2024-12-17 · 4 阅读 · AI/人工智能

AI应用通用人工智能 AI Agent 检索增强生成大语言模型

临床试验8年缩到几分钟？Genmab在OpenAI DevDay展示了AI Agent的真威力

临床试验8年缩到几分钟？Genmab在OpenAI DevDay展示了AI Agent的真威力

在OpenAI DevDay的舞台上，Genmab抛出了一个让所有AI从业者竖起耳朵的说法：不是99%，而是100%准确率，AI才能真正进入临床试验核心流程。他们展示的不是Demo，而是一套已经把“小时级工作压缩到分钟级”的AI Agent框架。

api_bot · 2024-12-17 · 5 阅读 · AI/人工智能

AI应用 AI Agent 检索增强生成上下文窗口大语言模型

Vercel在DevDay放话：软件不再属于开发者

Vercel在DevDay放话：软件不再属于开发者

在OpenAI DevDay的舞台上，Vercel的AI负责人抛出一个刺耳却真实的判断：未来最重要的软件，可能不再是“给开发者写的”。v0展示的不是又一个玩具Demo，而是一条正在成型的生产力路线。

api_bot · 2024-12-17 · 9 阅读 · AI/人工智能

AI应用 AI Agent 代码生成生成式AI AI工具

他们没堆参数，靠自博弈训练出“真能干活”的AI工程师

他们没堆参数，靠自博弈训练出“真能干活”的AI工程师

在 OpenAI DevDay 的聚光灯下，Cosine 展示了一个反直觉结论：真正能落地的 AI Agent，不是更大的模型，而是更会“自己练”的模型。Genie 作为全自动 AI 工程师，靠推理 + 自博弈，把工程任务变成了可规模化的能力。

api_bot · 2024-12-17 · 3 阅读 · AI/人工智能

模型训练 AI Agent AI推理

OpenAI 研究负责人亲口说：真正让 AI 更安全的，不是限制，而是让它“多想一会儿”

OpenAI 研究负责人亲口说：真正让 AI 更安全的，不是限制，而是让它“多想一会儿”

在这场 OpenAI DevDay 的炉边谈话中，Mark Chen 抛出了一个反直觉观点：o1 这样的“推理模型”，既是能力飞跃，也是过去一年最重要的安全进展之一。从 AGI 的真实边界，到新加坡为何被 OpenAI 视为 AI 高地，这是一场只讲内部认知、不讲公关套话的对话。

api_bot · 2024-12-17 · 8 阅读 · AI/人工智能

微调强化学习通用人工智能 AI Agent 生成式AI

企业级 AI Agent 最大的坑，不是模型不聪明，而是不知道先用哪把工具

企业级 AI Agent 最大的坑，不是模型不聪明，而是不知道先用哪把工具

在 OpenAI DevDay 的社区舞台上，Sana AI 抛出了一个反直觉结论：企业级 AI Agent 失败的真正原因，往往不是模型能力不够，而是工具调用顺序错了。这场分享不仅有真实产品 Demo，还给出了一套可复用的 Agent 设计方法论。

api_bot · 2024-12-17 · 6 阅读 · AI/人工智能

AI应用 AI Agent 对话AI 提示工程 AI搜索

他们用AI代理把临床试验文书从“小时级”压到“分钟级”

他们用AI代理把临床试验文书从“小时级”压到“分钟级”

在 OpenAI DevDay 的舞台上，Genmab 抛出了一个让全场安静下来的观点：在临床试验里，99% 的准确率等于失败。他们展示了一套名为 CELI 的 AI Agent 框架，如何把原本需要数小时的人类专业工作，压缩到几分钟完成，而且目标只有一个——100% 可用于监管提交。

api_bot · 2024-12-17 · 6 阅读 · AI/人工智能

Sam Altman AI应用 AI Agent 检索增强生成生成式AI

他们在Minecraft里养AI社会：Altera用一场实验击穿Agent最大瓶颈

他们在Minecraft里养AI社会：Altera用一场实验击穿Agent最大瓶颈

如果AI Agent不是帮你跑5分钟任务，而是能连续“活”上一周，会发生什么？在OpenAI DevDay上，Altera给出了一个让全场安静的答案：AI会自发形成宗教、经济、协作与长期目标。这不是科幻，而是一次对Agent致命缺陷的正面挑战。

api_bot · 2024-12-17 · 8 阅读 · AI/人工智能

AI Agent 神经网络幻觉上下文窗口大语言模型

一次跑不准不代表能上线：Sierra 用 TAU-bench 戳破 AI Agent 最大幻觉

一次跑不准不代表能上线：Sierra 用 TAU-bench 戳破 AI Agent 最大幻觉

在 OpenAI DevDay 的舞台上，Sierra 抛出一个让所有 AI Agent 团队不太舒服的事实：你的智能体“看起来能跑”，并不等于“真的可靠”。TAU-bench 用一种近乎残酷的方式证明——只跑一次评测，几乎毫无意义。

api_bot · 2024-12-17 · 4 阅读 · AI/人工智能

AI Agent 生成式AI 幻觉对话AI 大语言模型

社群

|

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

2 月前

🔥 本周热读