AI识别访谈录音，即可诊断AD所处阶段？

2022-07-29 17:06:00
王岳
争鸣与其他;
1.9W次
分享

微信扫一扫分享

来源：神经现实

作者：王岳

关注机构：

联系机构：

摘要：他们开发了一种自然语言处理（NLP）模型，能通过将访谈录音转换为文本的方式，有效诊断出老年痴呆的不同阶段。在诊断老年痴呆上，该模型的AUC高达926%，而此前已有诊断模型的AUC约在80%左右。除此以外，在区分普通人与轻度认知障碍（MCI），以及MCI与老年痴呆上，该模型也分别得到了744%与88%的AUC。

关键词：AI识别,诊断AD所处阶段,认知障碍患者,自然语言处理

一个安静的下午，王阿姨走进客厅，要拿什么东西。这时，突然来了一通房产推销电话。阿姨性子直，三下两下就把电话掐了。可是阖上电话以后，她却茫然地站在客厅里，忘记了自己本来要干的事情。从那以后，王阿姨一直害怕自己得了老年痴呆（即阿尔兹海默病），焦虑搅得她心神不宁。她一边相信自己不是，一边又暗暗怀疑。那么，王阿姨究竟有没有得老年痴呆？

想要获得一个准确答案并没有想象中那么简单。目前，对老年痴呆的诊断方法有以下几种：一、使用生物标志物进行评估。常见的生物标志物有斑块和神经原纤维缠结。二、通过磁共振成像评估神经退行性变的发展情况。这些方法虽然有利于大脑病变的早期诊断，但它们同时也要求患者具备充分的医疗资源。三、也是人们最常见到的检查方式，是通过面对面访谈的形式进行的神经心理学检查。在这样的检查中，医生会让患者完成一系列测试并予以评估。

然而，19年发表于《柳叶刀-神经元》的报告显示，我国城乡地区、各级医院的诊断资源和水平存在明显差异。目前仅有约10%的三级医院设立了记忆门诊和痴呆症中心。而在没有相应资源的医院，认知障碍则由缺乏痴呆症专业培训的神经科医生基于个人的临床经验进行诊断。在资源匮乏的县级医院里，老年痴呆的诊断更是由相关经验更加缺乏的内科医生诊断。上述因素都容易导致大量误诊漏诊，使患者陷入不必要的困境中。

21年中国老龄协会发布的报告显示，与医疗资源匮乏相对应的，则是中国近6%的老年痴呆患病率以及将近1510万的老年痴呆患者[3]。中国目前亟需一个可靠且有效的诊疗辅助工具，从而实现对老年痴呆的早筛查、早诊断、早干预。

好消息是，一个便利的诊断方法已经出现。本月，来自波士顿大学工程学院的萨马德·阿米尼（Samad Amini）与他的研究团队发表了一篇文章。他们开发了一种自然语言处理（NLP）模型，能通过将访谈录音转换为文本的方式，有效诊断出老年痴呆的不同阶段。

论文题目：

Automated detection of mild cognitive impairment and dementia from voice recordings: A natural language processing approach

DOI：https://doi.org/10.1002/alz.12721

1，利用录音内容诊断痴呆症

此前，已有机器学习算法能够从录音里提取声音和词汇特征来建立诊断模型，但是，大多数的研究依赖于人工转录以及手动制作的声音数据特征，耗时较长且成本高昂。阿米尼的团队利用语音识别、声纹分割聚类、句子编码器等NLP技术，实现了全诊断流程的自动化，收获了良好的诊断表现。

团队收集了来自一项大型慢性病研究的大量医疗数据，这些数据包含了133条神经心理学检查的录音文件，囊括了多达1084名患者的测试信息。测评总共涵盖8个子任务，针对语言能力、视感知技能、病前智力、抽象推理、注意力、视觉与语言短期记忆、联想学习能力等认知功能进行测量。在预处理中，研究员首先使用谷歌语音工具（Google Speech tool）将录音转成文字。他们随后微调了谷歌ALBERT-xlarge自然语言处理模型，利用一种类似命名实体识别（Named Entity Recognition）类型的方法将患者和医师的句子进行标签和区分。在这之后，研究者将录音数据分成训练集与测试集，然后使用转录数据以及真值标签（ground truth label）对BERT模型进行调整和训练，用以预测每句话所对应的测评类型。

由于训练数据的不足，研究者利用迁移学习来捕捉句子中出现的重要特征。在预处理之后，他们使用通用句子编码器（Universal Sentence Encoder）（一个基于Transformer架构和注意力机制的神经网络）将患者所说的句子编码成嵌入向量。这些嵌入向量会经过特征选择，生成认知能力分数。随后，认知分数和人口统计的信息会一起用来训练分类器。一旦生成了定量数据（也就是这些编码的句子），诊断模型系统就会使用多层感知器（Multilayer Perceptron）和逻辑回归等机器学习技术来计算个人存在认知障碍的可能性。

将录音数据转化为认知评估的流程示意图。箭头上方和下方分别总结了每个步骤的目标及其对应的方法

在机器学习中，曲线下面积（AUC）代表了分类器区分不同类别的能力。AUC越高，模型能够区分不同类别的能力就越强。在诊断老年痴呆上，该模型的AUC高达92.6%，而此前已有诊断模型的AUC约在80%左右。除此以外，在区分普通人与轻度认知障碍（MCI），以及MCI与老年痴呆上，该模型也分别得到了74.4%与88%的AUC。

2，对于医疗诊断的意义

显然，这个基于人工智能的诊断系统暂时还不能独当一面。首先，它对MCI的识别能力仍有待加强。由于MCI经常是老年痴呆的早期表现，对MCI的早期筛查和干预才是人们更为关注的重点。其次，它在诊断过程中仍然只能起到辅助作用，其诊断结果仍然需要医生进行进一步的验证和确认。不过，研究人员也认为，收集更多的纵向数据能帮助机器学习模型更敏感地捕捉到认知能力的变化，自动化工具本身也能有效减轻医疗人员操作负担。因此，我们有理由相信，这个研究代表了一个前景良好的积极开端，而非一锤定声的测试结果。

该研究的合著者扬尼斯·帕沙里德斯（Ioannis Paschalidis）表示，这样的诊断工具对发展大规模自动化医疗评估至关重要。在未来，它可以发展成一个多语言、低成本、大范围的网页诊断工具，从而让患者在家轻松完成远程医疗诊断。原作者也认为，认知测评的可及性是一个全球性问题，发展出这样的工具能够造福千万缺乏医疗资源的认知障碍患者。

最后，我们来回答开头王阿姨的问题。如果在看到某个相关的物品后，你能想起来自己原来要做的事情，那么有很大几率你还没有痴呆。之所以会发生这样的情况，是因为大脑的临时内存（工作记忆容量）不够，使这个信息暂时从思维的河流中消失了。然而，这样的小观察还远不能被称为诊断标准。希望有朝一日，我们可以等到升级版的痴呆诊断系统，让王阿姨所属的风险人群能够简单、快捷地观测和记录自己的认知状况，从日复一日的焦虑和怀疑中得到解脱。

作者：童宁聪 | 封面：freepik
编辑：光影 | 排版：Sheryl

展开全部

上一章：当自闭症孩子拥有了这样的技能，融合不再难！听贾美香专家说下一章：5岁孤独症孩子的“双城干预”生活是什么样？