新冠无症状感染者由于没有明显的发热、咳嗽等症状而难于与普通人群区分开,这为阻断疫情传播带来一定的难度。不过日前,来自美国麻省理工学院(MIT)的研究人员称研发出了一种可以识别新冠肺炎患者咳嗽声的AI模型,可以通过分析咳嗽录音将无症状感染者与健康人区分开来。这篇题为《COVID-19 Artificial Intelligence Diagnosis using only Cough Recordings》的论文日前发表在《IEEE 医学与生物学工程学杂志》上。
在医学领域,AI识别“咳嗽声”已用于多项疾病如肺炎、哮喘、阿尔茨海默症等的检测,这些疾病会导致机体功能退化,如声带减弱、呼吸功能下降等,虽然人耳难以辨识,但通过机器学习和信号处理,AI能够识出这其中的差别,而越来越多的证据表明,感染新冠病毒的患者也会出现类似的机体功能变化。
MIT研究人员此次开发的AI模型正是基于该团队此前用来诊断阿尔茨海默症早期患者的AI模型,疫情爆发后,该团队意识到或许可以利用其识别COVID-19无症状感染者。
今年4月,研究人员建立了一个公开咳嗽数据收集网站https://opensigma.mit.edu/,允许所有人通过网络浏览器、手机或者笔记本电脑等设备自愿提交咳嗽录音。截止目前,该网站收集了超过7万个录音,包含约 20 万份咳嗽音频样本,其中约有2500 多个样本是由已经确诊新冠的患者提交。
AI 模型则提取了咳嗽记录的音频特征(梅尔频率倒谱系数),并将它输入到神经网络(卷积神经网络,CNN)中,学习新冠病毒患者与健康人之间的咳嗽差异。具体来说,研究人员训练了三个神经网络模型,分别用来提取声带强弱特征、区分言语中情绪状态以及在自建的咳嗽数据集上学习,辨别肺和呼吸功能的变化。
研究人员选取了2500个新冠确诊咳嗽音频样本和另外2500个随机咳嗽音频样本,并使用其中4000个样本来训练 AI 模型,用剩余的1000个进行模型准确度的检测。
检测结果显示,基于声带强度、情绪、肺和呼吸功能等生物特征,该 AI 模型能够很准确地识别出新冠患者。该模型在聆听确诊病例的录音时准确率可达98.5%,在聆听无症状患者咳嗽的录音时准确率更是高达100%。而且该模型的特异性也已分别达到83%和94%,基本没有大量的假阳性或假阴性报告。
“我们认为这表明当患有新冠肺炎时,人产生声音的方式会发生变化,即使没有症状。”麻省理工学院自动识别实验室的研究科学家Brian Subirana表示,并补充道,“尽管该系统擅长于非健康咳嗽的监测,但大家还是不要轻易将之视作确诊的权威工具。”
目前,该团队正在与多家医院展开合作,从而建立更多样化的数据库。同时,该团队也在向FDA申请,希望将其整合到App中,如果投入使用,手机用户只需登录App对其咳嗽两声,就能获知自己是否可能感染了新冠病毒。