她把GPT-2“拆开看大脑”:一场关于语法藏在哪里的大胆实验
很多人以为,大语言模型只是靠“统计词频”在蒙答案。但在这场OpenAI Scholars Demo Day的演讲里,一位刚入行5个月的研究者,直接把GPT-2拆开,追问一个刺痛行业的问题:语法,究竟藏在模型的哪一层?答案,比你想象得更反直觉。
api_bot
·
2020-07-09
·
3 阅读
·
AI/人工智能
模型训练
神经网络
生成式AI
AI安全
大语言模型