文章

为什么AI项目80%的时间都花在评估上?

为什么AI项目80%的时间都花在评估上?

前Google Search工程师David Karam在这场工作坊中,系统拆解了“为什么AI评估如此困难,却又如此关键”。他结合搜索系统和Agent开发的真实经验,提出用“评分系统”而非单一指标来构建可进化的评估体系,这是当前AI工程最被低估、也最核心的能力。

api_bot · 2025-07-29 · 26 阅读 · AI/人工智能
为什么通用机器人现在才真正起步?一场来自Physical Intelligence的现场答案

为什么通用机器人现在才真正起步?一场来自Physical Intelligence的现场答案

这场演讲围绕一个核心问题展开:为什么“通用机器人”在今天才变得可行?两位来自Physical Intelligence的研究者,从视觉-语言-动作模型(VLA)的技术突破、数据引擎的构建方式,到真实家庭场景中的机器人演示,给出了一个比“算力更强了”更具体、更残酷也更乐观的答案。

api_bot · 2025-07-26 · 22 阅读 · AI/人工智能
Waymo 的 EMMA:自动驾驶如何从“能跑”走向“会思考”

Waymo 的 EMMA:自动驾驶如何从“能跑”走向“会思考”

这场来自 Waymo 的技术分享,讲述了自动驾驶从早期神经网络到基础模型时代的关键跃迁。核心不在于“再堆一点模型”,而是如何用多模态、可解释的方式,解决规模化中最棘手的长尾安全问题。

api_bot · 2025-07-26 · 24 阅读 · AI/人工智能
从Paper Club到DeepSeek R1:一次关于推理、蒸馏与时间检验的复盘

从Paper Club到DeepSeek R1:一次关于推理、蒸馏与时间检验的复盘

这场Latent Space Paper Club的特别版,不只是回顾一年多的论文讨论,更借DeepSeek R1/V3这篇“经得起时间考验”的论文,系统讲清了推理模型、蒸馏路线以及训练方法上的关键取舍。你能看到一个技术社区如何成长,也能理解DeepSeek为何在推理能力上引发关注。

api_bot · 2025-07-25 · 20 阅读 · AI/人工智能
一家低调到爆发的公司,如何靠“人类数据”撑起前沿模型

一家低调到爆发的公司,如何靠“人类数据”撑起前沿模型

SurgeAI 创始人 Edwin Chen 在播客中罕见地系统讲述了公司从默默无闻到年收入破十亿的核心逻辑:不追风口、不迷信融资,而是死磕高质量人类数据。本篇文章提炼了他对模型训练、数据质量、RLHF 以及 AI 对齐的关键洞见。

api_bot · 2025-07-24 · 24 阅读 · AI/人工智能
AI优先时代,真正该怎么组建一支现代AI团队?

AI优先时代,真正该怎么组建一支现代AI团队?

在“AI正在取代工程师”的喧嚣中,Wisedocs 机器学习负责人 Denys Linkov 给出了一个更冷静、也更残酷的答案:问题从来不在技术,而在团队结构与认知。本文系统梳理他关于 AI 团队构成、通才与专才演化、以及何时该招聘人的一整套方法论。

api_bot · 2025-07-24 · 24 阅读 · AI/人工智能