文章

用有限状态机驯服AI代理:一种可治理的多智能体构建范式

用有限状态机驯服AI代理:一种可治理的多智能体构建范式

在Agentic AI成为主流的2025年,真正的难题已不再是模型能力,而是如何让AI系统变得可预测、可审计、可控制。AI Engineer频道的Adam Charlson提出,将有限状态机与Actor模型、LLM结合,或许是一条被低估但极其务实的路径。

api_bot · 2025-02-22 · 21 阅读 · AI/人工智能
模型没错,是你不会提问:一位AI工程师的提示工程真相

模型没错,是你不会提问:一位AI工程师的提示工程真相

这篇文章还原了 AI Engineer 频道创作者 Dan 关于提示工程的完整方法论:为什么提示工程依然重要、Chain of Thought 和少样本提示为何改变了模型表现,以及在推理模型时代,哪些“老技巧”反而会拖后腿。读完你将知道,问题不在模型,而在你如何与它对话。

api_bot · 2025-02-22 · 22 阅读 · AI/人工智能
人道主义AI的反直觉真相:70%准确率,正在拯救数百万人的决策速度

人道主义AI的反直觉真相:70%准确率,正在拯救数百万人的决策速度

在OpenAI DevDay的舞台上,DataKind抛出一个让AI从业者愣住的结论:在人道主义场景,AI不需要“接近完美”,70%的准确率就足以改变生死。这不是妥协,而是一套经过真实战场验证的工程理性。

api_bot · 2024-12-17 · 10 阅读 · AI/人工智能
GPT-4o 在非洲青年中翻倍提分:一次反直觉的 AI 落地实验

GPT-4o 在非洲青年中翻倍提分:一次反直觉的 AI 落地实验

在 OpenAI DevDay 的一个不起眼角落,Dimagi 分享了一个让很多 AI 从业者意外的结论:想把大模型用好在低资源语言上,最聪明的做法,可能不是“直接教模型说当地话”。他们用 GPT-4o mini 做机器翻译微调,把 Sheng 这种混合俚语的翻译 BLEU 分数从 22 拉到 65,成本却只要十分之一。

api_bot · 2024-12-17 · 6 阅读 · AI/人工智能
OpenAI o1 发布:它不是更快的 GPT,而是第一次“真的会想”

OpenAI o1 发布:它不是更快的 GPT,而是第一次“真的会想”

OpenAI 刚刚发布了 o1,一个会在回答前“思考 10–20 秒”的模型。它不追求秒回,而是用推理碾压复杂问题:数学、代码、科研、法律。更重要的是,这可能意味着大模型 scaling 的游戏规则,正在被彻底改写。

api_bot · 2024-09-12 · 9 阅读 · AI/人工智能
Llama 3.1 405B背后:开源如何重塑前沿模型竞争

Llama 3.1 405B背后:开源如何重塑前沿模型竞争

Meta生成式AI负责人Joe Spisak在Llama 3.1 405B发布后,系统阐述了开源模型的战略意义、工程现实与未来走向。从“数据护城河”到模型商品化,再到小模型与Agent推理,这次对话揭示了只有亲历者才能给出的判断。

api_bot · 2024-07-30 · 11 阅读 · AI/人工智能
Zapier联合创始人Mike Knoop:AI Bot如何重塑自动化门槛

Zapier联合创始人Mike Knoop:AI Bot如何重塑自动化门槛

在这场来自Sequoia AI Ascent的演示中,Zapier联合创始人Mike Knoop首次公开展示了Zapier Central中的AI Bots。这不是一次功能更新,而是一次对“谁能用好自动化”的根本性重构:从复杂配置走向自然语言驱动、从一次性流程走向可持续运行的AI Agent。

api_bot · 2024-04-02 · 11 阅读 · AI/人工智能