Karpathy 亲述:我每天这样用 LLM,才发现 90% 的人都用错了
这不是一场教你“怎么写 Prompt”的视频,而是 Andrej Karpathy 亲自拆解:他到底把大语言模型当成什么在用。从聊天、思考模型、工具调用,到 Deep Research 和自定义 GPT,这套用法直接拉开了“会用”和“真正会用”之间的差距。
这不是一场教你“怎么写 Prompt”的视频,而是 Andrej Karpathy 亲自拆解:他到底把大语言模型当成什么在用。从聊天、思考模型、工具调用,到 Deep Research 和自定义 GPT,这套用法直接拉开了“会用”和“真正会用”之间的差距。
这场演讲给出了一个非常具体、可落地的判断:软件开发正在从“人+IDE里的AI助手”,走向“人+一群自治运行的编码Agent”。通过真实的单元测试Agent Guru,演讲者展示了Agent如何成为代码库里的“正式贡献者”,以及未来开发者真正该专注的价值所在。
这是一篇关于AI Agent如何被错误营销、以及这种叙事为何正在伤害开发者与产品本身的文章。来自前GitHub Copilot开发者布道师的亲身经验,提出了一套“克制而真实的拟人化”框架,帮助AI工具在获得采用率的同时,避免透支开发者信任。
这支视频展示了一个真正投入生产的AI视频剪辑Agent是如何被构建出来的。从最初被FFmpeg限制住的真实需求,到选择可被LLM“写代码”的视频引擎,再到带视觉反馈的Agent架构,这是一条非常工程化、也极具启发性的路线。
这是一场不为开源模型“站台”的分享,却意外揭示了它们最真实的使用场景。通过一张用户数据“饼图”,演讲者拆解了创作、编程与AI Agent背后的真实需求,解释了为什么很多人嘴上不提开源模型,却每天都在用它们。
一个从没写过代码的人,用 Cursor 本身,把 Cursor 的前端“重做”了一遍,还上线了。更反直觉的是:真正限制 AI 编程工具的,可能根本不是模型能力,而是界面。这个实验,把整个 AI Coding 工具的竞争逻辑翻了出来。
Anthropic被曝出到2027年冲击120亿美元、甚至345亿美元营收的激进预测。这不仅是财务故事,更揭示了它押注API、代码生成和治理加速的独特路径,以及与OpenAI截然不同的竞争逻辑。
基于Anthropic最新发布的“经济指数”和Claude真实使用日志,这期《The AI Daily Brief》试图回答一个所有人都在担心的问题:AI究竟会先冲击哪些工作?答案既没有想象中激进,也远比直觉更耐人寻味。
Google发布Gemini 2.0 Pro后,外界最关心的并非单一模型强弱,而是它折射出的行业趋势:预训练是否撞墙、推理阶段扩展的价值,以及当模型“都足够好”之后,竞争真正转向了哪里。
如果你还以为写应用必须先写代码,这个视频会直接把你拉回现实。Riley Brown 用 Cursor 演示了一种正在蔓延的开发方式:不敲键盘,只和 AI Agent 对话,就把一个接近 ChatGPT 的应用跑了起来。这不是玩具,而是很多程序员已经在用的“Vibe Coding”。