文章

25分钟、零代码:Claude 3.7+Cursor把“做App”这件事彻底改写了

25分钟、零代码:Claude 3.7+Cursor把“做App”这件事彻底改写了

如果你还以为“做一个App”至少需要会写代码,那你已经落后了。Riley Brown 用 Claude 3.7 Sonnet 在 Cursor 里,从零开始、几乎不碰代码,在 25 分钟内做出了一个可用的 AI 应用。这不是教学视频,而是一次对“软件开发门槛”的正面爆破。

api_bot · 2025-02-27 · 5 阅读 · AI/人工智能
从Copilot到自治代理:编码Agent如何重塑软件开发

从Copilot到自治代理:编码Agent如何重塑软件开发

这场演讲给出了一个非常具体、可落地的判断:软件开发正在从“人+IDE里的AI助手”,走向“人+一群自治运行的编码Agent”。通过真实的单元测试Agent Guru,演讲者展示了Agent如何成为代码库里的“正式贡献者”,以及未来开发者真正该专注的价值所在。

api_bot · 2025-02-22 · 14 阅读 · AI/人工智能
当大模型“没学过这门课”:用规则补齐LLM的知识盲区

当大模型“没学过这门课”:用规则补齐LLM的知识盲区

这支视频讨论了一个常被忽视的问题:当大语言模型进入几乎没有训练数据的领域时,该如何继续发挥价值?作者提出了一种务实的方法——用“可验证的规则和经验法则”去弥补知识缺口,让模型在低知识密度领域依然具备可用的推理能力。

api_bot · 2025-02-22 · 11 阅读 · AI/人工智能
为什么你的大模型评估毫无意义,以及真正可行的修复方法

为什么你的大模型评估毫无意义,以及真正可行的修复方法

许多团队投入大量精力做LLM评估,却依然在生产环境频频翻车。本文基于AI Engineer的一场演讲,解释为什么常见的评估体系会“看起来很好、实际上没用”,以及如何通过持续对齐评估器、数据集和真实用户需求,让评估真正产生价值。

api_bot · 2025-02-22 · 20 阅读 · AI/人工智能
YC眼中的AI下一站:当智能体开始成为真正的“用户”

YC眼中的AI下一站:当智能体开始成为真正的“用户”

Y Combinator最新发布的2025年春季“创业请求”,几乎是一份未来AI产业路线图。本文基于The AI Daily Brief的视频解读,系统梳理YC如何看待AI应用、AI智能体(Agents)以及支撑它们的基础设施,并重点展开几个极具前瞻性的判断:智能体将成为软件的新用户,推理成本将重塑AI架构,而软件工程师的角色正在发生根本变化。

api_bot · 2025-02-05 · 8 阅读 · AI/人工智能