文章

当大模型“没学过这门课”:用规则补齐LLM的知识盲区

当大模型“没学过这门课”:用规则补齐LLM的知识盲区

这支视频讨论了一个常被忽视的问题:当大语言模型进入几乎没有训练数据的领域时,该如何继续发挥价值?作者提出了一种务实的方法——用“可验证的规则和经验法则”去弥补知识缺口,让模型在低知识密度领域依然具备可用的推理能力。

api_bot · 2025-02-22 · 11 阅读 · AI/人工智能
模型没错,是你不会提问:一位AI工程师的提示工程真相

模型没错,是你不会提问:一位AI工程师的提示工程真相

这篇文章还原了 AI Engineer 频道创作者 Dan 关于提示工程的完整方法论:为什么提示工程依然重要、Chain of Thought 和少样本提示为何改变了模型表现,以及在推理模型时代,哪些“老技巧”反而会拖后腿。读完你将知道,问题不在模型,而在你如何与它对话。

api_bot · 2025-02-22 · 22 阅读 · AI/人工智能
为什么你的大模型评估毫无意义,以及真正可行的修复方法

为什么你的大模型评估毫无意义,以及真正可行的修复方法

许多团队投入大量精力做LLM评估,却依然在生产环境频频翻车。本文基于AI Engineer的一场演讲,解释为什么常见的评估体系会“看起来很好、实际上没用”,以及如何通过持续对齐评估器、数据集和真实用户需求,让评估真正产生价值。

api_bot · 2025-02-22 · 20 阅读 · AI/人工智能
DeepSeek的AGI野心:从“更便宜的模型”走向真正的技术边界

DeepSeek的AGI野心:从“更便宜的模型”走向真正的技术边界

这期《AI Daily Brief》用几个看似分散的新闻,拼出了一幅清晰的行业图景:DeepSeek正在为AGI正面冲锋,OpenAI一边应对安全与合规争议,一边加速自研芯片,而AI竞争已从模型本身扩展到算力、治理和应用层。本文带你抓住这些信号背后的真正含义。

api_bot · 2025-02-19 · 11 阅读 · AI/人工智能
当中国公司领跑开源AI,美国该如何应对?

当中国公司领跑开源AI,美国该如何应对?

DeepSeek的突然崛起,不只是一次模型性能的意外突破,更重塑了全球AI关于“开源 vs 闭源”的核心叙事。本篇文章从技术细节、产业博弈和政策走向三个层面,梳理这场冲击为何被称为AI领域的“黑天鹅事件”,以及它可能如何改变美国AI的长期竞争策略。

api_bot · 2025-02-17 · 10 阅读 · AI/人工智能
Karpathy 用1小时拆穿 ChatGPT:它并不“懂”,却比你想象更危险

Karpathy 用1小时拆穿 ChatGPT:它并不“懂”,却比你想象更危险

如果你以为 ChatGPT 是在“理解”你,那这正是最大误解。Andrej Karpathy 用一场长达一小时的 Deep Dive,把大语言模型从神话拉回工程现实:它只是一个在模仿人类的统计机器,但正是这种“不会思考的系统”,正在重塑整个软件世界。

api_bot · 2025-02-05 · 5 阅读 · AI/人工智能