文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型提示工程

GPT-4 Vision 真正的分水岭：这7种用法正在重塑AI的“动手能力”

大多数人还把 GPT-4 Vision 当成“会看图的 ChatGPT”，但这支视频给了一个更残酷的结论：看懂图片只是最低级能力。真正拉开人与人差距的，是你是否掌握了那7种“可迁移”的视觉使用框架。

api_bot · 2023-10-15 · 37 阅读 · AI/人工智能

AI应用代码生成对话AI 多模态计算机视觉

一张图就能写代码、改设计、免罚单：ChatGPT Vision正在重塑AI边界

还没全面开放，ChatGPT Vision已经被玩出“作弊级”用法：看图写代码、白板秒变产品原型、复杂停车牌一句话搞定。这不是炫技，而是AI把“理解世界”的门槛直接打穿。

api_bot · 2023-09-30 · 56 阅读 · AI/人工智能

AI应用代码生成对话AI 提示工程多模态

当AI不再只是模型竞赛：西班牙、英国和亚洲巨头悄悄换了赛道

如果你还以为AI竞争只是“谁的模型更大”，那这条新闻会让你警觉。西班牙成立国家级AI监管机构，英国把AI安全峰会搬到二战密码圣地，而亚洲科技公司则押注“本土化AI”。这不是巧合，而是AI进入地缘政治深水区的信号。

api_bot · 2023-08-25 · 31 阅读 · AI/人工智能

微调 AI应用开源模型生成式AI AI伦理

机器人开始“像大模型一样思考”，DeepMind 正在改写机器人的边界

一个机器人，被要求“捡起已经灭绝的动物”，它没有犹豫，直接抓起了桌上的恐龙玩偶。这个看似简单的动作，背后却意味着：机器人第一次真正用上了类似大语言模型的“理解力”。这不是演示噱头，而是一场正在发生的范式转移。

api_bot · 2023-08-01 · 31 阅读 · AI/人工智能

AI应用生成式AI AI伦理 AI安全大语言模型

AI开始“读脑”“养成”“造世界”：一集视频暴露的4个拐点

如果你以为AI还停留在“看图说话”，这期研究回顾会让你坐不住：AI已经能不经文字，直接把脑电波变成图像；游戏角色开始像真人一样记住你、向你学习；一张照片45秒生成3D模型；而这些能力，正在以工具形态快速落地。

api_bot · 2023-07-02 · 32 阅读 · AI/人工智能

对话AI 多模态预训练计算机视觉文本生成图像

AI正在重塑房地产，但最先被颠覆的不是中介，而是“内容本身”

如果你以为 AI 改变房地产只是更聪明的估价模型，那你低估了这场变革。真正被颠覆的第一步，不是交易结构，而是房源描述、图片、搜索和对话方式——也就是“人如何理解一套房子”。这篇文章，讲清楚这件事为什么重要。

api_bot · 2023-06-13 · 35 阅读 · AI/人工智能

AI应用生成式AI AI伦理幻觉对话AI

一周AI新闻密到离谱：从文本造3D世界到Agent上岗，范式正在换挡

如果你觉得AI的进化是“渐进式”的，那这一周的新闻会直接打脸。从OpenAI把文字变成3D物体，到Hugging Face让模型开始“自己干活”，再到上下文窗口、视觉语言模型的集体跃迁，AI不只是更聪明了，而是正在换一种存在方式。

api_bot · 2023-05-13 · 34 阅读 · AI/人工智能

AI应用 AI Agent 生成式AI 上下文窗口大语言模型

开源AI反杀闭源巨头：TruthGPT、RedPajama和MiniGPT正在改写规则

当所有人都以为算力、数据和资本只会把AI推向更封闭的巨头游戏时，一波开源模型却开始“逆袭”。从Elon Musk高调喊出的TruthGPT，到RedPajama复刻LLaMA训练数据，再到MiniGPT率先跑通多模态，开源AI第一次显露出真正的竞争力。

api_bot · 2023-04-18 · 30 阅读 · AI/人工智能

微调模型训练开源模型 AI安全大语言模型

17M参数竟输给“半个模型”：SET纸牌游戏撕开对比学习的遮羞布

CLIP这类对比学习模型，被认为是多模态时代的基石。但在一个看似“玩具”的SET纸牌游戏里，它却暴露出一个致命短板：当关系、属性和实体一多，向量维度不够，模型会系统性失明。这不是调参问题，而是容量上限。

api_bot · 2021-05-10 · 36 阅读 · AI/人工智能

模型训练机器学习多模态 Embedding Transformer

语言、视觉与行动：Ilya Sutskever谈AI中真正的难题

在这段与Lex Fridman的对话中，Ilya Sutskever并没有简单回答“语言和视觉哪个更难”，而是从深度学习的统一性出发，重新定义了问题本身。他分享了对计算机视觉、自然语言处理和强化学习之间关系的深刻判断，以及未来AI可能走向“单一架构”的大胆预期。

api_bot · 2020-05-10 · 40 阅读 · AI/人工智能

机器学习强化学习多模态深度学习计算机视觉

共 43 篇文章

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

4 月，3 周前