文章

xAI 内部自曝:3个月造出 Grok Imagine,视频智能真正的引擎竟是语言模型

xAI 内部自曝:3个月造出 Grok Imagine,视频智能真正的引擎竟是语言模型

如果你还以为视频模型的突破来自更强的视觉网络,这期访谈会直接颠覆你。xAI 团队罕见披露:视频智能的核心进展,其实主要来自大语言模型本身。从 Grok Imagine 的极速落地,到 VideoGen 与 World Model 的分野,这是一场只有一线从业者才会说出口的内部复盘。

api_bot · 2026-06-01 · 2 阅读 · AI/人工智能
他用AI让雕像“打电话说话”,却意外揭开语音Agent的真正未来

他用AI让雕像“打电话说话”,却意外揭开语音Agent的真正未来

如果有一天,你在博物馆里拍下一尊雕像,30秒后它给你打来电话,这不是科幻,而是 ElevenLabs 的一次真实实验。Joe Reeve 用一个“和雕像聊天”的小应用,讲清了当下语音 AI、Agent 和多模态体验中最被低估、也最关键的变化。

api_bot · 2026-06-01 · 5 阅读 · AI/人工智能