从文本到实体：OpenAI Shap‑E让3D打印走到AI爆发前夜

AI PM 编辑部 · 2023年05月08日 · 2 阅读 · AI/人工智能

AI应用微调开源模型闭源模型 AI搜索大语言模型生成式AI 模型部署对话AI 模型训练

正在加载视频...

视频章节

当大家还在为AI画图、剪视频而兴奋时，OpenAI已经把手伸向了更“现实”的世界：3D。一次看似低调的发布，背后却串起了搜索、语音助手、开源模型和制造业的同一条暗线。

从文本到实体：OpenAI Shap‑E让3D打印走到AI爆发前夜

当大家还在为AI画图、剪视频而兴奋时，OpenAI已经把手伸向了更“现实”的世界：3D。一次看似低调的发布，背后却串起了搜索、语音助手、开源模型和制造业的同一条暗线。

真正反直觉的不是搜索，而是“界面”正在消失

如果你以为这条视频最大的看点是OpenAI，那你可能忽略了更大的信号。Google正在重做搜索，但重点不是“更聪明”，而是“更不像搜索”。Project Magi 被形容为“snackable”——短视频、社交内容、碎片化信息。这其实是一种妥协：在AI时代，用户不再想要10个蓝色链接，而是要“直接给我答案”。

这并非Google一家的困境，而是整个互联网20年旧范式的终结。搜索框+链接列表，是为人类设计的；而当AI开始代替人类去读、去总结、去生成内容时，界面本身就必须被重写。这也是为什么Google宁愿冒着颠覆自己现金牛的风险，也要在I/O前夕放出信号：体验要变，而且必须由AI驱动。

Amazon和开源社区，正在用两种方式“去中心化AI”

另一边，Amazon对Alexa的反思更耐人寻味。CEO在财报会上提到，Alexa的未来不只是更大的模型，而是“重新定义它能做什么”。从一个被调侃为“只能设闹钟”的语音助手，到能即兴生成儿童故事，这背后是对生成式AI商业边界的重新想象。

但真正让大厂夜不能寐的，可能是开源社区的速度。RedPajama、MPT‑7B、Wizard Vicuna……在短短六周内，开发者已经能在本地跑出接近 GPT‑3.5 水平的聊天模型。训练成本被压到20万美元量级，部署不需要云，不需要API。这正应了那篇泄露的Google内部备忘录的判断：不是闭源模型不够强，而是开源进化得太快。

一个重要变化正在发生：AI能力正在从“平台特权”变成“基础设施”。

Shap‑E：最被低估的一步，是让AI开始“碰到现实”

在一堆宏大叙事中，OpenAI发布的Shap‑E看起来像个小玩具：输入一句话，生成一个3D模型——牛油果椅子、香蕉飞机、树形座椅。但真正危险的地方在于：这是“文本→物理世界”的第一块拼图。

Rowan Chung那句评价点破了本质：Text‑to‑3D Printing 很快会成为现实。今天我们已经习惯了Text‑to‑Image、Text‑to‑Video，而3D意味着什么？意味着游戏资产、影视道具、工业原型，甚至是直接送进3D打印机的文件。

它现在当然还很粗糙，但方向已经非常清晰：人类用自然语言表达意图，AI负责把意图变成“可制造的对象”。一旦这条链路成熟，设计、制造、供应链都会被重写。Shap‑E不是终点，而是OpenAI第一次把生成式AI明确指向“现实世界的原子”。

总结

把这些碎片连在一起，你会看到一条清晰的趋势线：界面在消失，能力在下沉，AI正在从“帮你写字画图”，走向“帮你改变世界”。对从业者来说，机会不只在模型本身，而在模型落地的那一层：新交互、新工具链、新工作流。一个值得思考的问题是：如果未来“描述”本身就是生产力，你现在掌握的技能，哪一些会被放大，哪一些会被直接跳过？

关键词： Shap-E，生成式AI，开源大模型， AI搜索， 3D打印

事实核查备注：需要核查：1）Shap‑E发布者为OpenAI研究员Alex Nichol；2）MPT‑7B训练成本约20万美元、9.5天完成；3）Wizard Vicuna接近GPT‑3.5的评价来自社区实验；4）Google Project Magi相关信息源自当周媒体报道；5）视频发布时间为2023‑05‑08。

返回文章列表