文章

GPT-4 Vision 真正的分水岭:这7种用法正在重塑AI的“动手能力”

GPT-4 Vision 真正的分水岭:这7种用法正在重塑AI的“动手能力”

大多数人还把 GPT-4 Vision 当成“会看图的 ChatGPT”,但这支视频给了一个更残酷的结论:看懂图片只是最低级能力。真正拉开人与人差距的,是你是否掌握了那7种“可迁移”的视觉使用框架。

api_bot · 2023-10-15 · 37 阅读 · AI/人工智能
当AI不再只是模型竞赛:西班牙、英国和亚洲巨头悄悄换了赛道

当AI不再只是模型竞赛:西班牙、英国和亚洲巨头悄悄换了赛道

如果你还以为AI竞争只是“谁的模型更大”,那这条新闻会让你警觉。西班牙成立国家级AI监管机构,英国把AI安全峰会搬到二战密码圣地,而亚洲科技公司则押注“本土化AI”。这不是巧合,而是AI进入地缘政治深水区的信号。

api_bot · 2023-08-25 · 31 阅读 · AI/人工智能
机器人开始“像大模型一样思考”,DeepMind 正在改写机器人的边界

机器人开始“像大模型一样思考”,DeepMind 正在改写机器人的边界

一个机器人,被要求“捡起已经灭绝的动物”,它没有犹豫,直接抓起了桌上的恐龙玩偶。这个看似简单的动作,背后却意味着:机器人第一次真正用上了类似大语言模型的“理解力”。这不是演示噱头,而是一场正在发生的范式转移。

api_bot · 2023-08-01 · 31 阅读 · AI/人工智能
AI开始“读脑”“养成”“造世界”:一集视频暴露的4个拐点

AI开始“读脑”“养成”“造世界”:一集视频暴露的4个拐点

如果你以为AI还停留在“看图说话”,这期研究回顾会让你坐不住:AI已经能不经文字,直接把脑电波变成图像;游戏角色开始像真人一样记住你、向你学习;一张照片45秒生成3D模型;而这些能力,正在以工具形态快速落地。

api_bot · 2023-07-02 · 32 阅读 · AI/人工智能
AI正在重塑房地产,但最先被颠覆的不是中介,而是“内容本身”

AI正在重塑房地产,但最先被颠覆的不是中介,而是“内容本身”

如果你以为 AI 改变房地产只是更聪明的估价模型,那你低估了这场变革。真正被颠覆的第一步,不是交易结构,而是房源描述、图片、搜索和对话方式——也就是“人如何理解一套房子”。这篇文章,讲清楚这件事为什么重要。

api_bot · 2023-06-13 · 35 阅读 · AI/人工智能
一周AI新闻密到离谱:从文本造3D世界到Agent上岗,范式正在换挡

一周AI新闻密到离谱:从文本造3D世界到Agent上岗,范式正在换挡

如果你觉得AI的进化是“渐进式”的,那这一周的新闻会直接打脸。从OpenAI把文字变成3D物体,到Hugging Face让模型开始“自己干活”,再到上下文窗口、视觉语言模型的集体跃迁,AI不只是更聪明了,而是正在换一种存在方式。

api_bot · 2023-05-13 · 34 阅读 · AI/人工智能
开源AI反杀闭源巨头:TruthGPT、RedPajama和MiniGPT正在改写规则

开源AI反杀闭源巨头:TruthGPT、RedPajama和MiniGPT正在改写规则

当所有人都以为算力、数据和资本只会把AI推向更封闭的巨头游戏时,一波开源模型却开始“逆袭”。从Elon Musk高调喊出的TruthGPT,到RedPajama复刻LLaMA训练数据,再到MiniGPT率先跑通多模态,开源AI第一次显露出真正的竞争力。

api_bot · 2023-04-18 · 30 阅读 · AI/人工智能
17M参数竟输给“半个模型”:SET纸牌游戏撕开对比学习的遮羞布

17M参数竟输给“半个模型”:SET纸牌游戏撕开对比学习的遮羞布

CLIP这类对比学习模型,被认为是多模态时代的基石。但在一个看似“玩具”的SET纸牌游戏里,它却暴露出一个致命短板:当关系、属性和实体一多,向量维度不够,模型会系统性失明。这不是调参问题,而是容量上限。

api_bot · 2021-05-10 · 36 阅读 · AI/人工智能
语言、视觉与行动:Ilya Sutskever谈AI中真正的难题

语言、视觉与行动:Ilya Sutskever谈AI中真正的难题

在这段与Lex Fridman的对话中,Ilya Sutskever并没有简单回答“语言和视觉哪个更难”,而是从深度学习的统一性出发,重新定义了问题本身。他分享了对计算机视觉、自然语言处理和强化学习之间关系的深刻判断,以及未来AI可能走向“单一架构”的大胆预期。

api_bot · 2020-05-10 · 40 阅读 · AI/人工智能