他没学过设计,却用GPT-4o Vision一口气做完一款AI聊天App

AI PM 编辑部 · 2025年03月29日 · 10 阅读 · AI/人工智能

正在加载视频...

视频章节

如果你还以为“做一个好看的AI应用”需要设计稿、UI库和审美天赋,这个视频会直接打脸。Riley Brown 用 GPT-4o Vision 截图+一句话提示,在一个下午里把一款 Claude 聊天应用从“能用”改到“好看、好玩、还想用”。更重要的是,这背后透露出一个正在改变AI产品形态的信号。

他没学过设计,却用GPT-4o Vision一口气做完一款AI聊天App

如果你还以为“做一个好看的AI应用”需要设计稿、UI库和审美天赋,这个视频会直接打脸。Riley Brown 用 GPT-4o Vision 截图+一句话提示,在一个下午里把一款 Claude 聊天应用从“能用”改到“好看、好玩、还想用”。更重要的是,这背后透露出一个正在改变AI产品形态的信号。

最反直觉的地方:设计,不再是人类的护城河

视频一开始就给了人一个暴击:Riley 直接展示了一个完整的 AI Chat App——有背景图、有侧边栏、有音乐、有笔记浮窗,整体风格统一,甚至有点“Studio Ghibli 风”。而他反复强调的一句话是:“我没有任何设计技能。”

真正反直觉的不是他做出了一个 Claude Clone,而是这个 Clone 的“审美”几乎完全由 GPT-4o Vision 决定。他的流程非常粗暴:截图 Claude 官网 → 丢给 ChatGPT → 一句话描述想要的感觉(干净、好看、有云有草)→ 直接生成整站风格图。

过去我们会说,工程师可以很快做出功能,但“好看”是另一条战线,需要设计师、设计系统、反复评审。现在这个分工正在被打穿。GPT-4o Vision 不只是画图,而是在把“视觉判断”变成一种可被调用的能力。你不需要知道什么是对齐、留白或配色,只需要会描述“我想要什么感觉”。

真正的狠活:截图 + Prompt,直接驱动代码重构

更有料的部分在中段。Riley 并不是把生成的图当“参考”,而是直接把它作为目标状态,丢给 Cursor 里的 Claude:“请把这个 Next.js 模板改成看起来像这张图。”

这里发生了一件以前很难想象的事:视觉 → 代码 的闭环。截图不再只是灵感,而是设计规格本身。Claude 在“thinking max mode”下,一边理解 UI 结构,一边重构样式、布局和组件层级。

过程中当然有报错、有 fork repo、有 debug,但节奏非常快。Riley 的操作像是在和一个“全栈+设计”的合体 AI 对话:哪里太白、哪里不透明、输入框要灰一点、AI 回复要蓝白渐变、有边框但别太重……这些原本需要多轮设计评审的细节,变成了连续的自然语言指令。

一个很容易被忽略的点是:他几乎没有写 CSS。大部分视觉调整,都是通过语言完成的。这意味着,未来 UI 的瓶颈不在于写代码,而在于你能不能说清楚你想要什么。

“Vibe Coding”不是玩笑,这是新一代AI产品的气质

到后半段,视频开始变得“不务正业”:加音乐、加笔记、加浮窗、调位置、换名字。应用被命名为 Vibe Chat,这不是随便起的。

Riley 一边听着 ChatGPT 生成的冥想音乐,一边让 AI 帮他把笔记面板从侧边栏改成悬浮窗;选中 AI 回复里的文字,点一个“+”,就能丢进随手笔记。这些功能并不“刚需”,但它们极大地改变了使用感受。

这恰恰点中了一个趋势:AI 应用正在从“效率工具”走向“情绪空间”。不只是快、不只是准,而是“待着舒服”。

值得注意的是,整个过程没有产品经理文档,没有设计稿,没有需求评审。只有三样东西:多模态模型(GPT-4o Vision)、强执行力的代码助手(Claude in Cursor),以及不断试错的自然语言指令。这种工作方式,Riley 自己称为——vibe coding。

这条视频真正的行业信号:个人AI产品的门槛被重新定义

如果只把这条视频当成一个“炫技 Demo”,那就低估它了。它真正释放的信号是:个人开发者能交付的产品上限,被大幅抬高了。

过去你需要:前端能力 + 后端能力 + 设计协作 + 若干周时间。现在你需要的可能是:会截图、会描述感觉、敢于让 AI 重来。

GPT-4o Vision 负责“看懂世界”,Claude 负责“把世界实现出来”,Cursor 负责把这一切变成可运行的代码。三者组合,正在形成一种新的默认工作流。

这也解释了为什么越来越多 AI 应用开始“长得都不错”——不是因为设计师突然变多了,而是审美本身正在被模型规模化

总结

这条视频最值得AI从业者记住的,不是某个炫酷功能,而是一个现实变化:“做得好看”正在从稀缺能力,变成基础能力。 当视觉理解、代码生成、交互修改都能被一句话驱动,个人开发者第一次有机会把时间花在“感觉对不对”,而不是“能不能实现”。

如果你正在做 AI 产品,今天就可以行动:选一个你觉得“丑但能用”的界面,截图,丢给 GPT-4o Vision,让它给你一个新世界。真正的问题也许不是“AI 能不能做到”,而是——你敢不敢把控制权交出去一点。


关键词: GPT-4o Vision, Vibe Coding, 多模态AI, Claude, AI应用设计

事实核查备注: 需要核查:视频发布时间(2025-03-29)、视频标题原文、是否明确提到使用 GPT-4o Vision 命名、Claude 使用的是 thinking max mode、应用名称为 Vibe Chat