一场从零到部署的现场课:SGLang如何把LLM服务推向极限性能
这是一场少见的“边讲边干”的LLM Serving工作坊。Baseten的工程师通过SGLang,从框架历史、现场部署到推理性能优化,展示了大模型服务真正的工程细节,以及为什么“让模型跑得快”远比选模型更复杂。
这是一场少见的“边讲边干”的LLM Serving工作坊。Baseten的工程师通过SGLang,从框架历史、现场部署到推理性能优化,展示了大模型服务真正的工程细节,以及为什么“让模型跑得快”远比选模型更复杂。
一个看似荒诞的故事:从网上看到一个创业点子,用AI快速做出来,公开在推特上边做边吆喝,8天后直接卖掉,进账1.5万美元。更猛的是,这套方法并不靠运气,而是可复制的“AI时代造项目流水线”。
这支视频拆解了一家金融机构的AI落地全过程:从领导层共识、流程重构,到与Anthropic合作打造可用工具,最终在新闻与财报分析中一年节省21.3万小时。真正的挑战不在模型,而在组织如何学会使用它。
Google披露其月度AI Token处理量在两个月内翻倍,成为观察AI产业进入“自我加速期”的关键证据。本文从谷歌财报、OpenAI云合作、马斯克的XAI筹资博弈,以及Lovable的爆炸式增长,串联起AI基础设施、应用和资本的最新变化。
Pydantic作者Samuel Colvin在一次AI Engineer演讲中,抛出了一个反直觉观点:在生成式AI飞速变化的今天,真正不该被忽视的,是类型安全和工程基本功。他用真实代码演示解释了,为什么Agent并不神秘,以及为什么类型系统正在成为AI应用可维护性的核心。
这场Latent Space Paper Club的特别版,不只是回顾一年多的论文讨论,更借DeepSeek R1/V3这篇“经得起时间考验”的论文,系统讲清了推理模型、蒸馏路线以及训练方法上的关键取舍。你能看到一个技术社区如何成长,也能理解DeepSeek为何在推理能力上引发关注。
Google Labs 的产品经理 Rustin Banks 在这场演讲中,讲述了异步编码代理 Jules 的诞生背景、真实使用案例,以及它如何迫使开发者从“串行思维”转向“并行思维”。这不仅是一个新工具的发布,更是一种全新开发范式的预演。
Cognition创始人Scott Wu回顾了过去12-18个月打造Devin的真实经历,提出了一个判断AI Agent能力的关键指标,并用多个阶段性故事解释:为什么软件工程正在从“人写代码”走向“人管理Agent”。
在这场分享中,OpenHands 联合创始人 Robert Brennan 以一线工具构建者的视角,拆解了“软件开发代理”到底是什么、擅长什么、不擅长什么,以及开发者该如何与它们协作。他给出的不是宏大叙事,而是一套能立刻改变你工作方式的心智模型。
很多AI编码工具能快速写出“能跑的代码”,却难以进入生产环境。Imbue CTO Josh Albrecht通过真实开发经验,系统拆解了AI代码质量失控的根源,并给出一套从预防到检测、修复的完整方法论,解释如何让AI真正成为可靠的软件工程师。