文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型通用人工智能

英语模型迁移到中文有多难？OpenAI一组Scaling Laws给了残酷答案

很多人直觉认为：只要模型够大、预训练够久，语言迁移自然水到渠成。但在 OpenAI Scholars Demo Day 上，Christina Kim 用一组冷静的数据告诉我们——预训练确实有用，但它的“性价比”，和语言、数据规模、模型大小强相关，而且远没有想象中均匀。

api_bot · 2021-05-10 · 23 阅读 · AI/人工智能

微调模型训练机器学习大语言模型预训练

对比学习在语言上翻车了？OpenAI 学者的实验揭示一个被忽视的难题

在计算机视觉里横扫榜单的对比学习，一搬到自然语言却问题频出。OpenAI Scholars Demo Day 上，Ellie Kitanidis 公开了一次并不“完美”的尝试：用对比学习预训练语言模型。真正的猛料不在结果，而在她暴露出的那个几乎所有语言模型都会撞上的隐形难题。

api_bot · 2021-05-10 · 16 阅读 · AI/人工智能

机器学习大语言模型预训练深度学习计算机视觉

AlphaFold 2：一次可能改变生命科学走向的AI突破

2020年，DeepMind发布AlphaFold 2，被认为解决了困扰生物学50年的蛋白质折叠难题。Lex Fridman在视频中不仅解释了技术突破本身，更从AI与生命科学交汇的角度，讨论了它为何可能成为一个“诺贝尔奖级别”的起点。

api_bot · 2020-12-02 · 24 阅读 · AI/人工智能

模型训练机器学习深度学习计算机视觉 Google DeepMind

François Chollet：为何深度学习仍未触及真正的智能

在这期 Lex Fridman 播客中，Keras 作者 François Chollet 直面一个尖锐问题：今天的深度学习模型，究竟是在“理解”，还是在“记忆”？他从语言、视觉、数据规模与泛化能力出发，系统阐述了自己对智能本质的定义，以及为何 ARC 基准测试被设计成反主流的存在。

api_bot · 2020-08-31 · 17 阅读 · AI/人工智能

深度学习

神经网络如何学会画螺旋：一场直观到残酷的实验

Lex Fridman 通过 TensorFlow Playground 的可视化实验，展示了神经网络在不同结构与超参数下，如何逐步学会（或学不会）复杂数据分布。短短几分钟的视频，揭示了模型容量、特征工程与直觉理解之间的深刻联系。

api_bot · 2020-07-19 · 18 阅读 · AI/人工智能

模型训练机器学习神经网络深度学习监督学习

她把GPT-2“拆开看大脑”：一场关于语法藏在哪里的大胆实验

很多人以为，大语言模型只是靠“统计词频”在蒙答案。但在这场OpenAI Scholars Demo Day的演讲里，一位刚入行5个月的研究者，直接把GPT-2拆开，追问一个刺痛行业的问题：语法，究竟藏在模型的哪一层？答案，比你想象得更反直觉。

api_bot · 2020-07-09 · 12 阅读 · AI/人工智能

模型训练神经网络生成式AI AI安全大语言模型

OpenAI 学者演示：一个奖励延迟，足以让强化学习彻底“迷路”

强化学习最怕什么？不是算力不够，也不是模型不深，而是奖励来得太晚。Cathy Yeh 在 OpenAI Scholars Demo Day 上用一系列实验，展示了一个反直觉事实：只要时间跨度拉长，聪明的 agent 也会像“失忆”一样乱试。这场分享的核心，是她如何用 Temporal Reward Transport（TRT）正面解决这个老大难问题。

api_bot · 2020-07-09 · 13 阅读 · AI/人工智能

强化学习深度学习

预测癫痫发作这件事，神经网络可能比医生更早“看见”信号

直到20年前，医学界还在争论一件事：癫痫发作到底能不能被预测？在 OpenAI Scholars Demo Day 上，一位神经科学出身的研究者用深度学习给出了一个并不完美、却足够震撼的答案——不仅能，而且很可能正是神经网络最擅长的那类问题。

api_bot · 2020-07-09 · 16 阅读 · AI/人工智能

模型训练神经网络深度学习计算机视觉 OpenAI

她在 OpenAI Demo Day 提了个反直觉结论：文本生成，比图像难多了

2018 年的 OpenAI Scholars Demo Day 上，Nadja Rhodes 没有炫技模型参数，而是抛出一个让人不太舒服的事实：生成文本，远比生成图像更容易“失败到不可看”。她的项目 Deephypebot，不只是一个音乐评论机器人，而是一场关于“如何让语言模型不再胡说八道”的实验。

api_bot · 2020-07-02 · 12 阅读 · AI/人工智能