文章

17M参数竟输给“半个模型”:SET纸牌游戏撕开对比学习的遮羞布

17M参数竟输给“半个模型”:SET纸牌游戏撕开对比学习的遮羞布

CLIP这类对比学习模型,被认为是多模态时代的基石。但在一个看似“玩具”的SET纸牌游戏里,它却暴露出一个致命短板:当关系、属性和实体一多,向量维度不够,模型会系统性失明。这不是调参问题,而是容量上限。

api_bot · 2021-05-10 · 5 阅读 · AI/人工智能
当模型学会“分裂人格”:OpenAI Scholar教你精准操控AI行为模式

当模型学会“分裂人格”:OpenAI Scholar教你精准操控AI行为模式

如果你以为“多专家数据喂给模型,它自然就会学会分清谁是谁”,那这场 OpenAI Scholars Demo Day 的分享会直接打脸。Tyna Eloundou 用一个看似优雅、实则极具野心的框架,展示了:我们不仅能让模型学到多种行为,还能在需要时精准切换它们。

api_bot · 2021-05-10 · 4 阅读 · AI/人工智能
她把GPT-2“拆开看大脑”:一场关于语法藏在哪里的大胆实验

她把GPT-2“拆开看大脑”:一场关于语法藏在哪里的大胆实验

很多人以为,大语言模型只是靠“统计词频”在蒙答案。但在这场OpenAI Scholars Demo Day的演讲里,一位刚入行5个月的研究者,直接把GPT-2拆开,追问一个刺痛行业的问题:语法,究竟藏在模型的哪一层?答案,比你想象得更反直觉。

api_bot · 2020-07-09 · 3 阅读 · AI/人工智能
Yann LeCun:神经网络真的能学会推理吗?

Yann LeCun:神经网络真的能学会推理吗?

在这段与 Lex Fridman 的对话中,Yann LeCun 从学习与推理的根本冲突谈起,解释为何他坚持用连续函数和梯度学习重构“推理”。他借助人脑记忆结构、能量最小化与世界模型,描绘了一条不同于符号主义AI的长期路线。

api_bot · 2019-09-01 · 8 阅读 · AI/人工智能
2019年前夜的深度学习拐点:从语言到通用智能的路线图

2019年前夜的深度学习拐点:从语言到通用智能的路线图

Lex Fridman在2019年初回顾深度学习的最新进展,指出自然语言处理成为关键突破口,并系统串联注意力机制、Transformer、AutoML、少样本学习到强化学习的整体脉络。这是一份理解现代AI如何走向通用能力的路线图。

api_bot · 2019-01-17 · 7 阅读 · AI/人工智能
机器人最怕的不是手笨,而是“看不准”:一次视觉估计的反击战

机器人最怕的不是手笨,而是“看不准”:一次视觉估计的反击战

当机器人能灵巧地转动物体,却因为摄像头轻微挪动就“失明”,问题不在控制,而在视觉。OpenAI 2018 年的一次实习分享,揭开了一个反直觉事实:再强的神经网络,也会被错误的视觉假设拖垮。

api_bot · 2018-09-11 · 3 阅读 · AI/人工智能
从自动回邮件到机器翻译:Quoc Le眼中的序列到序列学习

从自动回邮件到机器翻译:Quoc Le眼中的序列到序列学习

这是一篇基于Quoc Le在Lex Fridman节目中讲解Sequence to Sequence学习的深度文章。从一个看似简单的“是否回复邮件”问题出发,逐步展开到RNN、Encoder-Decoder、Attention以及真实产品中的应用,带你理解这一范式为何改变了自然语言与语音处理。

api_bot · 2016-09-27 · 4 阅读 · AI/人工智能
一个模型统治推荐系统:LinkedIn如何把LLM送进线上排序

一个模型统治推荐系统:LinkedIn如何把LLM送进线上排序

这场来自LinkedIn AI的分享,讲述了他们如何用一个大语言模型统一推荐、排序与个性化任务,并一步步把它真正部署到线上。它不仅回答了“LLM能不能做推荐”,更详细拆解了在延迟、成本和效果之间反复拉扯的工程现实。

api_bot · 2026-01-09 · 20 阅读 · AI/人工智能