Falcon 180B发布:开源模型第一次正面逼近GPT-4
一个开源模型,参数1800亿,训练算力是LLaMA 2的4倍,实测性能击败GPT-3.5——而这还只是开始。Falcon 180B的发布,不只是技术里程碑,更把“强大AI该不该开源”的争论推到了必须表态的临界点。
一个开源模型,参数1800亿,训练算力是LLaMA 2的4倍,实测性能击败GPT-3.5——而这还只是开始。Falcon 180B的发布,不只是技术里程碑,更把“强大AI该不该开源”的争论推到了必须表态的临界点。
当马斯克、扎克伯格、黄仁勋、Sam Altman 同时出现在参议院闭门会议,这已经不是象征性的“聊聊天”。一边是公众对 AI 的集体焦虑飙升,一边是媒体开始反击模型训练,这场发生在华盛顿的 AI 聚会,正在悄悄决定未来几年行业的边界。
Transformer共同作者Jakob Uszkoreit在播客中回顾了AI架构的关键转折,并解释他为何离开Google创办Inceptive,试图把深度学习的方法论引入RNA药物研发,重新思考“软件”与“生命”的边界。
OpenAI 开放 GPT‑3.5 Turbo 微调,看起来只是一个功能更新,却意外点燃了企业 AI 的核心争议:数据该不该交给第三方?是继续烧钱自建模型,还是相信平台化微调?这可能比 GPT‑4 本身更具长期影响。
AI 芯片战场正在发生一件反直觉的事:英伟达几乎垄断,却没人敢说它稳赢。AMD、初创公司,甚至微软、谷歌、亚马逊都在亲自下场造芯。这不是技术秀,而是一场关乎算力、生死和地缘政治的硬仗。
很多人第一次用 ChatGPT 时都有一种错觉:语言智能的问题,好像已经被解决了。但一篇由剑桥、UCL、Meta AI 等机构联合完成的论文却泼了一盆冷水——我们可能才刚刚站在起点。真正的挑战,不是“模型不够大”,而是一整套尚未被驯服的复杂系统问题。
ChatGPT不是被夸得太猛,而是第一次被美国政府“正式盯上”。FTC一封20页调查函,把OpenAI的训练数据、幻觉问题、企业客户、甚至公司治理全部摊开检查。这不是一次普通调查,而是AI监管真空期里最具信号意义的一枪。
如果你以为AI还停留在“看图说话”,这期研究回顾会让你坐不住:AI已经能不经文字,直接把脑电波变成图像;游戏角色开始像真人一样记住你、向你学习;一张照片45秒生成3D模型;而这些能力,正在以工具形态快速落地。
当大家还在卷模型参数时,Sam Altman已经把目光投向“AI应用的分发权”。与此同时,更小的数据集击败大模型、新版图灵测试、地下芯片市场同时登场——这不是零散新闻,而是一场AI权力结构的重组。
当所有人都在问“AMD能不能打败英伟达”,真正让AI圈兴奋的却不是参数,而是一条不太起眼的合作线索。这条线,可能决定未来AI算力的玩法。