评估不是最后一步:Cedric Vidal谈AI Agent走向可靠性的关键路径
在这场由微软首席AI布道师Cedric Vidal带来的分享中,评估被重新定义为AI Agent开发的起点而非终点。通过手动评估、Spot Check到代码化和多模态评估的逐步演示,他展示了一条让Agent真正可控、可扩展的实践路径。
在这场由微软首席AI布道师Cedric Vidal带来的分享中,评估被重新定义为AI Agent开发的起点而非终点。通过手动评估、Spot Check到代码化和多模态评估的逐步演示,他展示了一条让Agent真正可控、可扩展的实践路径。
这场来自微软的分享,不是教你“怎么用Copilot写代码”,而是展示如何把AI代理真正嵌入软件开发工作流。通过现场演示和大量问答,演讲者拆解了Copilot Coding Agent的工作方式、适合的任务边界,以及最容易被忽视的安全与协作问题。
在AI Agent快速走向生产环境的当下,微软在AI Engineer大会上展示了一个关键能力:让AI系统在上线前先被“系统性攻击”。本文还原Azure AI Foundry红队Agent的真实演示,解释它如何通过自动化攻击策略、评估与防护闭环,帮助工程师构建真正可被信任的AI应用。
这场由GitHub的Christopher Harrison带来的演讲,不是介绍Copilot“能做什么”,而是聚焦一个更重要的问题:我们如何与一个逐渐具备代理能力的Copilot协作开发。通过实验室演示、指令设计和现场问答,视频揭示了Copilot从代码补全工具向“协作开发代理”转变的关键方法。
这场演讲不是在教你“如何用AI写代码”,而是在拆解一个更难的问题:当Vibe Coding从个人实验走向企业规模时,哪些地方一定会出问题,又该如何修正。Harald Kirshner用现场演示和反思,讲清了定制化AI助手的边界与可能性。
这场来自GitHub开发者布道师Jon Peck的分享,没有炫技式Demo,而是从个人使用、团队协作到治理与CI/CD,拆解AI如何一步步进入真实的DevOps体系。你会看到AI不是“开关”,而是一套需要被设计、被约束、被运营的能力。
这是一场关于如何把随性高效的 Vibe Coding 引入企业环境的实战分享。演讲者通过现场演示和方法论拆解,讲清了从混乱的“YOLO 编码”到可复制、可回滚、可扩展的结构化流程,企业团队该如何一步步落地定制化 AI 助手。
当云端AI仍在狂飙,微软却在系统性推进“本地AI”。在这场演讲中,Foundry Local首次完整展示了微软对边缘AI的判断、技术积累与真实落地方式,解释了为什么现在正是本地AI成熟的关键节点。
LlamaIndex 开发者关系副总裁 Laurie Voss 用 15 分钟浓缩了一个关键信息:真正能在生产中跑起来的 Agent,靠的不是“更聪明的模型”,而是扎实的设计模式。这场演讲从 RAG 的必要性讲起,逐步引出链式、路由和编排式等 Agent 架构,给出了一套可复用的方法论。
当AI大幅加速写代码的“内循环”,测试、评审、合并、部署的“外循环”正在成为新的瓶颈。Graphite联合创始人Tomas Reimers分享了他们如何用AI解决AI带来的问题,以及为什么未来的开发工具必须是“AI原生”的。