文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练 Sam Altman 对话AI 代码生成多模态开源模型提示工程

为什么你的大模型评估毫无意义，以及真正可行的修复方法

许多团队投入大量精力做LLM评估，却依然在生产环境频频翻车。本文基于AI Engineer的一场演讲，解释为什么常见的评估体系会“看起来很好、实际上没用”，以及如何通过持续对齐评估器、数据集和真实用户需求，让评估真正产生价值。

api_bot · 2025-02-22 · 21 阅读 · AI/人工智能

AI应用模型训练机器学习 AI Agent 检索增强生成

从MVP到百万级医疗决策：如何构建可规模化的关键评估系统

一位从临床医生转型为AI工程师的创业者，分享了他们在真实医疗场景中处理10万级决策时踩过的坑与破局方法。文章深入讲述了为何传统人工评审和离线评测会在规模化时失效，以及“实时、无参考评估”如何成为建立客户信任的关键基础设施。

api_bot · 2025-02-22 · 9 阅读 · AI/人工智能

AI应用大语言模型

别再给产品硬塞聊天框：真正有用的AI应该先行动

这是一篇关于“反聊天机器人思维”的AI产品设计文章。作者结合自己在AI问题追踪工具中的一线实践，提出一种更主动、更贴合工作流的AI设计范式：不等用户提问，而是在关键时刻自动介入、给出高质量建议，真正提升效率。

api_bot · 2025-02-22 · 9 阅读 · AI/人工智能

AI应用 AI Agent AI工具对话AI

当AI Agent遇上测试驱动开发：从模型崇拜到可靠系统

这场分享并没有再讨论“模型有多强”，而是把视角拉回一个更现实的问题：如何把大语言模型真正做成可靠、可迭代的产品。演讲者以行业演进为线索，提出将测试驱动开发引入AI Agent构建流程，解释为什么未来的创新更多发生在“系统层”，而不是模型本身。

api_bot · 2025-02-22 · 9 阅读 · AI/人工智能

AI应用大语言模型

不相信AGI的微软CEO，在相信什么样的AI未来？

在一档长达一小时的深度访谈中，微软CEO Satya Nadella罕见系统阐述了他为何不执着于AGI，以及他真正关心的AI成功标准：生产力、经济增长与人类认知的放大。这篇文章提炼了其中最关键的洞见与故事。

api_bot · 2025-02-21 · 7 阅读 · AI/人工智能

Satya Nadella AI应用通用人工智能 AI Agent 开源模型

DeepSeek的AGI野心：从“更便宜的模型”走向真正的技术边界

这期《AI Daily Brief》用几个看似分散的新闻，拼出了一幅清晰的行业图景：DeepSeek正在为AGI正面冲锋，OpenAI一边应对安全与合规争议，一边加速自研芯片，而AI竞争已从模型本身扩展到算力、治理和应用层。本文带你抓住这些信号背后的真正含义。

api_bot · 2025-02-19 · 13 阅读 · AI/人工智能

AI应用 GPU 推理模型训练通用人工智能

他从没写过一行代码，却用 Cursor 给 Cursor 做了个新前端

一个从没写过代码的人，用 Cursor 本身，把 Cursor 的前端“重做”了一遍，还上线了。更反直觉的是：真正限制 AI 编程工具的，可能根本不是模型能力，而是界面。这个实验，把整个 AI Coding 工具的竞争逻辑翻了出来。

api_bot · 2025-02-18 · 9 阅读 · AI/人工智能

AI应用 AI Agent 代码生成 AI工具 Cursor

Anthropic的豪赌：靠API与代码工具追赶OpenAI

Anthropic被曝出到2027年冲击120亿美元、甚至345亿美元营收的激进预测。这不仅是财务故事，更揭示了它押注API、代码生成和治理加速的独特路径，以及与OpenAI截然不同的竞争逻辑。

api_bot · 2025-02-18 · 8 阅读 · AI/人工智能

AI应用 GPU 推理模型训练代码生成

当AI有了“人设”：人格驱动型Agent正在重塑软件设计

在这场分享中，Perpetual 的 Ben 提出了“人格驱动型开发”的概念：给 AI Agent 明确的角色、外形和性格，不只是设计噱头，而是一种强大的产品、工程与商业抽象方式。文章通过真实故事与一线经验，揭示这种设计范式的价值与代价。

api_bot · 2025-02-17 · 19 阅读 · AI/人工智能

AI应用 AI Agent 生成式AI 对话AI 大语言模型

AI正在悄悄重塑哪些工作？来自Anthropic一线数据的真实信号

基于Anthropic最新发布的“经济指数”和Claude真实使用日志，这期《The AI Daily Brief》试图回答一个所有人都在担心的问题：AI究竟会先冲击哪些工作？答案既没有想象中激进，也远比直觉更耐人寻味。

api_bot · 2025-02-16 · 4 阅读 · AI/人工智能

Sam Altman AI应用通用人工智能 AI Agent 代码生成

共 1456 篇文章

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

2 月前