预测癫痫发作这件事，神经网络可能比医生更早“看见”信号

AI PM 编辑部 · 2020年07月09日 · 2 阅读 · AI/人工智能

正在加载视频...

视频章节

直到20年前，医学界还在争论一件事：癫痫发作到底能不能被预测？在 OpenAI Scholars Demo Day 上，一位神经科学出身的研究者用深度学习给出了一个并不完美、却足够震撼的答案——不仅能，而且很可能正是神经网络最擅长的那类问题。

预测癫痫发作这件事，神经网络可能比医生更早“看见”信号

直到20年前，医学界还在争论一件事：癫痫发作到底能不能被预测？在 OpenAI Scholars Demo Day 上，一位神经科学出身的研究者用深度学习给出了一个并不完美、却足够震撼的答案——不仅能，而且很可能正是神经网络最擅长的那类问题。

一个曾被认为“不存在”的信号，正在被神经网络捕捉

癫痫发作的残酷之处不在于疼痛，而在于不可预测。对全球约1%的人来说，随时可能失去意识意味着焦虑、受伤风险，以及“不能开车”这种长期剥夺生活自由的现实。更糟的是，直到不久前，医学界还在认真讨论：在发作真正发生之前，脑中是否真的存在任何可用的预警信号。

Kata Slama 在演讲中点出一个极具反差的事实：临床争论持续了几十年，但患者早就知道答案。有些癫痫患者能在发作前产生主观预感，甚至还有经过训练的狗可以提前发出警示。问题不在于“有没有信号”，而在于“我们不知道那是什么”。而这，恰恰是深度学习最擅长处理的场景——信号存在，但人类无法明确定义特征。

从神经电信号到图像：一次典型但不简单的深度学习建模

这项工作的数据并不来自某个封闭的医疗机构，而是来自 Kaggle 上公开的癫痫数据集：多只狗的大脑电压传感器记录。数据包含两类时间段——距离发作至少4小时的“安全期”，以及发作前1小时内的“危险期”。注意，这里没有任何真正的发作过程数据，模型预测的是“未来”。

处理方式非常工程化，却处处是坑。Slama 将连续时间序列切成小窗口，标注为安全或危险，然后把这些信号转换成频谱图（spectrogram）。这一步很关键：它把“神经科学问题”转译成了“计算机视觉问题”。频率分布、能量变化，这些人类难以手写规则的模式，变成了卷积神经网络可以直接学习的结构。

模型选择也很务实：ResNet-18，从零训练，没有用任何预训练权重。原因很简单——频谱图像不是自然图片，但 ResNet 在捕捉局部与层级结构方面已经被充分验证。

69% 准确率不惊艳，但这不是重点

如果你只盯着数字，可能会失望：在平衡后的数据集上，模型准确率约为69%，而随机猜测是55%。但在癫痫预测这种问题上，“准不准”从来不是单一指标。

真正关键的是权衡。你是更愿意漏掉一次真正的发作，还是多报几次虚惊？Slama 在演讲中特别强调了 ROC 曲线、Precision-Recall 曲线和混淆矩阵的重要性。模型的 AUC 大约在 0.77 左右，约72%的真实发作被成功标记为危险。这意味着：它已经能在统计意义上提前“看到”某些发作的前兆。

对比基线模型更能说明问题：带 batch normalization 的逻辑回归，只能做到接近随机水平。这不是参数量的问题，而是非线性结构确实在捕捉某种我们说不清的模式。

真正困难的，不是模型，而是“走出论文”

在问答环节中，讨论很快从模型转向现实世界：这些结果如何真正帮到患者？数据来自植入式电极还是头皮 EEG？不同患者之间的癫痫模式到底有多相似？

Slama 的回答非常克制，也非常诚实：目前的模型更像是“每个患者一个模型”，而不是通用解法。影响准确率的因素包括：更长的时间窗口、更干净的信号、更多数据，以及对多电极相关性的建模。这些都不是“再堆一层网络”就能解决的。

她提到，下一步真正让人兴奋的方向，不只是提升指标，而是解释模型——用 OpenAI Clarity 团队的方法、激活最大化等技术，去理解网络到底在“看”什么。这一步，决定了它是科研玩具，还是临床工具。

总结

这场演讲最值得 AI 从业者记住的，并不是 69% 这个数字，而是一个范式：当人类无法定义特征、却确信信号存在时，深度学习往往是唯一可行的工具。但同时，它也提醒我们，医疗 AI 的瓶颈很少在模型本身，而更多在数据、评估方式和落地路径上。

如果你在做时间序列、医学信号或任何“弱信号预测”问题，这个项目几乎是一个模板：频谱化、平衡数据、关注 ROC 而不是 accuracy，以及尽早思考解释性。真正的挑战不是把分数刷高，而是回答一个更难的问题——你敢不敢把这个模型交给真实世界使用？

关键词：癫痫预测，深度学习，神经网络，频谱图， OpenAI

事实核查备注：需要核查的数据点包括：癫痫全球患病率约1%；使用的数据集来源（Kaggle 癫痫狗数据集）；ResNet-18 的具体准确率和 AUC 数值；演讲时间为 2020-07-09，场合为 OpenAI Scholars Demo Day。

返回文章列表