文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型通用人工智能

Karpathy亲手写反向传播：为什么顶级研究员还在“原始手搓”梯度

当所有框架都能自动求导时，Andrej Karpathy却花一整节课，带你一行行手写反向传播。这不是怀旧，而是一种训练直觉的残酷方式。看完这期视频，你会明白：真正拉开模型训练差距的，不是更大的GPU，而是你对梯度流动的掌控力。

api_bot · 2022-10-11 · 8 阅读 · AI/人工智能

模型训练

Karpathy 这一课点破深度学习真相：模型不收敛，八成不是你不够聪明

很多人以为神经网络训练不好，是架构不行、数据不够、算力太小。但 Karpathy 在 makemore 第三讲直接揭穿了一个更残酷的事实：大多数失败，发生在训练开始的第一秒——初始化、激活值和梯度，早就把结局写好了。

api_bot · 2022-10-04 · 18 阅读 · AI/人工智能

模型训练神经网络模型部署深度学习

一个“会爆炸”的模型，如何逼出神经网络最关键的一跃

Karpathy 在 makemore 第二讲里，亲手演示了一个残酷事实：你以为还能靠统计和技巧硬撑的模型，会在规模一上来时彻底崩溃。而真正的转折点，不是调参，而是那一刻你被迫引入神经网络。

api_bot · 2022-09-12 · 18 阅读 · AI/人工智能

模型训练神经网络 Embedding

他用200行代码拆穿深度学习：为什么你必须自己写一遍反向传播

大多数人用 PyTorch 写神经网络，却从没真正“看见”梯度是怎么流动的。Andrej Karpathy 用一个叫 micrograd 的极简项目，亲手拆开了反向传播的黑箱：没有魔法、没有框架，只有链式法则。这支视频讲的不是“怎么用”，而是“为什么一切真的如此运作”。

api_bot · 2022-08-16 · 13 阅读 · AI/人工智能

模型训练神经网络

一个设计师用 TensorFlow 做了件狠事：让设计系统有了“AI 拼写检查”

设计系统最大的敌人不是规范不够，而是人类自己。一次 Config 演讲里，一位产品设计师展示了一个反直觉的原型：用 TensorFlow 给 Figma 做“拼写检查”，自动揪出设计系统里的隐形错误。这不是概念，而是已经跑起来的插件。

api_bot · 2022-05-19 · 33 阅读 · AI/人工智能

微调 AI应用模型训练机器学习计算机视觉

为什么说 Tesla AI Day 展示了通往真实智能的唯一路径

Lex Fridman 在解读 Tesla AI Day 时认为，这场发布会的震撼不在于单点技术突破，而在于首次完整展示了解决自动驾驶与通用机器人问题所需的“规模化工程全景”。从向量空间感知、多摄像头时序融合，到数据标注闭环与 Dojo 计算平台，Tesla 展示了一条难以复制的真实世界智能路线。

api_bot · 2021-08-20 · 17 阅读 · AI/人工智能

AI应用 GPU 模型训练机器学习强化学习

OpenAI 现场演示 Codex：从零分到写游戏，程序员真正慌了

这不是一次普通的产品发布，而是 OpenAI 当众展示：一个模型如何在一年内，从“代码准确率 0%”，进化到能写服务器、接 API、做小游戏。更反直觉的是，Ilya 亲口承认：这一切的原理，其实简单到令人不安。

api_bot · 2021-08-10 · 15 阅读 · AI/人工智能

模型训练神经网络代码生成大语言模型 Ilya Sutskever

一个Figma插件演讲，提前预演了“AI替你做设计”的未来

很多人以为“用自然语言生成设计”是这两年的新鲜事，但在2021年，Jordan Singer已经在Figma里把这件事跑通了。这场看似讲插件的分享，其实完整展示了：设计×代码×AI，是如何一步步把设计工具变成“可对话的创造机器”。

api_bot · 2021-05-24 · 17 阅读 · AI/人工智能

AI应用模型训练生成式AI 大语言模型提示工程

17M参数竟输给“半个模型”：SET纸牌游戏撕开对比学习的遮羞布

CLIP这类对比学习模型，被认为是多模态时代的基石。但在一个看似“玩具”的SET纸牌游戏里，它却暴露出一个致命短板：当关系、属性和实体一多，向量维度不够，模型会系统性失明。这不是调参问题，而是容量上限。

api_bot · 2021-05-10 · 22 阅读 · AI/人工智能

模型训练机器学习多模态 Embedding Transformer

他用Reddit训练AI审美，结果发现人类偏好有74%的天花板

OpenAI 学者 Jonathan Ward 做了一件反直觉的事：不用人工标注、不请外包标注员，而是直接拿互联网的“点赞”来训练奖励模型。结果很震撼——模型学会了人类偏好，但准确率卡在了 74%。这背后，藏着今天所有 RLHF 系统的真相与瓶颈。

api_bot · 2021-05-10 · 30 阅读 · AI/人工智能

微调模型训练机器学习强化学习 AI Agent

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

3 月，1 周前