文章

当推荐系统遇上大模型:三条正在成形的演进路线

当推荐系统遇上大模型:三条正在成形的演进路线

在这场Recsys主题演讲中,Eugene Yan没有讨论“要不要用大模型”,而是回答了“该怎么用”。他用一系列真实案例,提出了三条正在落地的路径:语义化ID、基于大模型的数据增强,以及统一模型,展示了推荐与搜索系统在LLM时代的真实进化方式。

api_bot · 2025-07-16 · 53 阅读 · AI/人工智能
全网吹爆的 Grok 4,被连续12轮实测后,真正适合谁

全网吹爆的 Grok 4,被连续12轮实测后,真正适合谁

很多人说 Grok 4 已经“全面超越 OpenAI”。但 Greg Isenberg 用 9 类 Agent、12 个高强度实测后,给出了一个更残酷也更真实的结论:它不是通用王者,而是一把用对场景才锋利的刀。这篇文章告诉你,它到底强在哪,又坑在哪。

api_bot · 2025-07-15 · 28 阅读 · AI/人工智能
当基准测试变成模因:是谁在悄悄塑造AI的未来

当基准测试变成模因:是谁在悄悄塑造AI的未来

Alex Duffy提出一个反直觉却极具力量的观点:AI基准测试不是中立工具,而是像“模因”一样会传播、进化,并最终塑造模型能力与人类价值。通过Pokémon、Diplomacy等生动案例,他揭示了谁在定义评测,谁就在定义AI要变成什么。

api_bot · 2025-07-15 · 54 阅读 · AI/人工智能
吴恩达:AI时代创业的速度、洞察与责任——从应用层到团队协作的变革

吴恩达:AI时代创业的速度、洞察与责任——从应用层到团队协作的变革

本文梳理了吴恩达在Y Combinator Startup School的精彩演讲,聚焦AI技术如何重塑创业速度、团队协作与产品开发。从“agentic AI”到代码生成工具的演进,再到创业者的决策方法和伦理选择,文章结合具体案例与金句,揭示了AI应用层的巨大机会与现实挑战。

api_bot · 2025-07-10 · 44 阅读 · AI/人工智能
GPT‑5真正重要的,不是更强,而是终于“合体”了

GPT‑5真正重要的,不是更强,而是终于“合体”了

这期《The AI Daily Brief》梳理了GPT‑5从“千呼万唤不出来”到即将登场的完整脉络。与其说它是一次性能飞跃,不如说是OpenAI对过去一年路线选择的总交付:统一推理、多模态与工具,重新定义普通用户和开发者如何使用AI。

api_bot · 2025-07-09 · 19 阅读 · AI/人工智能
没人讨论的亚马逊Q,正在CLI里悄悄碾压Claude Code和Gemini CLI

没人讨论的亚马逊Q,正在CLI里悄悄碾压Claude Code和Gemini CLI

当所有人都在对着Claude Code和Gemini CLI评头论足时,亚马逊已经把一个“真正能干活”的AI Agent塞进了命令行,而且还免费。它不只会写代码,还会自己跑命令、修Bug、维护上下文,像一个不抱怨的资深工程师。更反直觉的是:它背后用的还是Claude 3.5 Sonnet。

api_bot · 2025-07-04 · 28 阅读 · AI/人工智能