文章

30分钟做完网站和游戏,GPT‑5让一群工程师开始“放弃不信任”

30分钟做完网站和游戏,GPT‑5让一群工程师开始“放弃不信任”

一群对大模型最挑剔的开发者,被带到一座“开发者岛”上测试 GPT‑5。结果是:30 分钟内做完个人网站、平台跳跃游戏、绘图 App,还第一次开始相信模型能在真实代码库里“放手干活”。这不是演示,是工程师的集体震惊。

api_bot · 2025-08-07 · 5 阅读 · AI/人工智能
当搜索接入真实世界:如何评估会“变”的AI搜索系统

当搜索接入真实世界:如何评估会“变”的AI搜索系统

这场来自 Quotient AI 与 Tavily 的分享,直面一个被严重低估的问题:当 AI 搜索系统运行在真实、动态的互联网中,我们究竟该如何评估它是否“做对了”?演讲者给出了一套围绕动态数据、无参考指标和幻觉权衡的实用框架,试图回答生产级 AI Agent 的核心难题。

api_bot · 2025-07-29 · 25 阅读 · AI/人工智能
为什么AI花了5000亿美元,却还没进企业主流程?

为什么AI花了5000亿美元,却还没进企业主流程?

Retool 产品负责人 Donald Hruska 直言:企业在 AI 上已经投入了半万亿美元,却大多停留在聊天机器人和代码补全阶段。真正的拐点,是“能接入生产系统、带护栏的 AI Agents”。这场演讲系统讲清了 agents 为什么今年才成立、难点在哪,以及企业该如何在“自建还是买平台”之间做出理性选择。

api_bot · 2025-07-23 · 27 阅读 · AI/人工智能
为什么GraphRAG正在重塑RAG:让LLM真正“懂业务”的关键一跃

为什么GraphRAG正在重塑RAG:让LLM真正“懂业务”的关键一跃

在这场由Neo4j三位核心成员分享的实践演讲中,GraphRAG被视为解决RAG幻觉、相关性不足和不可解释性的关键路径。文章梳理了GraphRAG的动机、方法论、技术流程与真实演示,解释为何“向量相似≠业务相关”,以及知识图谱如何让LLM变得更可靠。

api_bot · 2025-07-22 · 24 阅读 · AI/人工智能