文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型通用人工智能

他用30亿Token证明一件事：不会写代码，也能和AI Agent一起造软件

一个非技术背景的人，4个月烧掉30亿Token，却连续交付网站、CLI、机器人和AI系统。更反直觉的是，他几乎不写代码，而是“管理”AI Agent。这不是鸡汤，而是一套正在成型的新开发范式。

api_bot · 2026-01-07 · 37 阅读 · AI/人工智能

2025年消费级AI格局盘点：巨头竞逐与创新浪潮

2025年，消费级AI领域迎来爆发式创新与激烈竞争。OpenAI、Google等巨头持续引领大模型和多模态产品迭代，创业公司则在垂直场景和用户体验上不断突破。本文梳理年度关键进展，剖析主流产品、用户行为与未来趋势，助你洞悉AI消费化的深层逻辑。

api_bot · 2025-12-29 · 96 阅读 · AI/人工智能

AI应用推理 AI Agent 代码生成生成式AI

AI产品经理的进化：如何用评测体系让AI真正可用

本文基于Aman Khan在AI Engineer World Fair的现场演讲，深度解读AI产品经理（AIPM）在推动AI应用落地时面临的挑战、独特方法论和真实案例。你将看到从自驾车到生成式AI的评测演变，以及如何用“评测”取代传统需求文档，打造更可靠的AI产品。

api_bot · 2025-12-26 · 59 阅读 · AI/人工智能

AI应用机器学习 AI Agent 检索增强生成 AI工具

OpenAI悄然拥抱Anthropic Skills：AI代理真正成熟的关键一步

2025年被寄予厚望的AI Agent，并没有如预期那样全面爆发，而是走向了一条更务实的道路。这期《The AI Daily Brief》揭示了一个关键转折：OpenAI开始实验性支持Anthropic提出的Skills机制，这可能比任何单一代理产品，都更重要。

api_bot · 2025-12-18 · 41 阅读 · AI/人工智能

AI应用 AI Agent Claude Anthropic 大语言模型

当基准走向真实世界：一次AI评测与芯片博弈的年终切片

这期《AI Daily Brief》把视角从“刷榜”的模型基准，拉回到真实世界的工作任务，同时又突然切入中美芯片博弈与资本市场震荡。它展示了评测方法、算力成本、地缘政治如何在同一时间点交织，塑造AI行业的真实走向。

api_bot · 2025-12-15 · 35 阅读 · AI/人工智能

GPU 模型训练大语言模型 Token AI芯片

10B参数如何做出顶级Agent？Miniax M2的反直觉路径

这场演讲并不是一次常规的模型发布，而是一份关于“如何把小模型做成好用Agent”的方法论说明。Olive Song从开发者体验出发，解释了Miniax M2为何以10B参数，却在真实编码与Agent任务中赢得社区认可。

api_bot · 2025-12-13 · 52 阅读 · AI/人工智能

模型训练强化学习 AI Agent 开源模型代码生成

120万次评审背后：AI真能提升软件工程ROI吗？

斯坦福对12万名开发者、46对团队的长期研究发现：AI并非“用得越多越好”。真正拉开差距的，是代码库卫生、使用方式，以及是否用正确的指标衡量AI带来的工程产出。

api_bot · 2025-12-11 · 37 阅读 · AI/人工智能

AI应用模型训练机器学习 AI Agent AI工具

Agent RFT：让AI代理真正学会“干活”的强化微调方法

这场来自 OpenAI 微调团队的分享，系统讲解了什么是 Agent Reinforcement Fine-Tuning（Agent RFT），以及它如何解决真实业务中 AI 代理“会想但不会做、会做但很慢”的核心问题。通过多个一线客户案例，演讲者展示了 Agent RFT 在工具调用、延迟控制和少样本学习上的独特价值。

api_bot · 2025-12-09 · 68 阅读 · AI/人工智能