您的当前位置:疟疾 > 疟疾症状 > 疟疾WebApp用深度学习加快疟疾诊
疟疾WebApp用深度学习加快疟疾诊
来源:Mdium编译:Bot
编者按:机器学习本质上是门工程学,把实验室里的算法、技术带入实际应用,这是很多科研人员、数据科学家的梦想。美国湾区有一个培训机构insight,它专门招收名校PhD,通过短期强化课程把初出茅庐的学生培养成符合企业需求的数据工作者,而在这个过程中,这些接收培训的学生也留下了一些非常有价值的应用。
本文介绍的CarlosAticoAriza是年秋季的insighthalth研究员,在加入insight之前,他在一家公司担任数据科学顾问,负责构建端到端机器学习解决方案,比如无需人为监督的异常检测系统。虽然从事的是数据方面的工作,但Ariza在大学获得的学位是化学和生物工程博士,他一直想为医学领域作出贡献。
在insight培训期间,Ariza部署了一个WbApp,能利用图像分析技术诊断患者是否患有疟疾,并列出治疗优先等级。这个应用成功让临床医生的疟疾诊断工作量降低了85%。
微小而致命的敌人对世界上超过半数的人来说,蚊子远不仅仅是一种滋扰:除了会引发皮肤瘙痒、敏感和失眠,它们也是疟疾、登革热等疾病的传播媒介。以疟疾为例,这是一种由疟原虫引起传染病,当感染子孢子经蚊虫叮咬进入人体血液后,它们会在肝细胞内进行裂体增殖,然后释入血液感染红细胞……借助蚊子强大的繁殖能力,年,全球已经有2亿多人新感染疟疾,每年因此死亡的人数超过40万!
疟疾诊断的瓶颈在诸多疟疾诊断方法中,医院的支柱,它的具体流程是先把患者血液涂抹在载玻片上,用造影剂染色以区分血红细胞内的寄生虫,然后经专业训练的临床医生再在倍的显微镜下,从个细胞里一个个计数包含寄生虫的血红细胞数(WHO方案)。
厚血涂片制作流程
可以想象,手动计数个细胞绝对会是个缓慢的过程,这对医疗人员来说也是个沉重的负担,尤其是在疟疾爆发的地区。面对这种情况,Ariza认为图像分析和机器学习会有很大的应用前景。
什么是F-bta考虑到医疗领域对检测准确率的严格要求,如果机器要自动化疟疾诊断过程,它绝不能从看似不含寄生虫的样本中遗漏哪怕一个寄生虫。为了降低误诊(假阴性)人数,Ariza希望模型在输出最终结果前,能重复进行三次检查:如果第一遍没发现,每隔8小时再采集一份厚血涂片并计数细胞数;如果三次都没发现寄生虫,则判定患者未受感染。
现在,这个任务就有了一个很直接的目标:减少假阴性。
事实上,假阴性不止能被作为降低误诊率的一个度量,它也能充当监督机器的指标。试想一下,如果我们训练了一个模型,它在实际进行图像分析时准确率奇低,这时医生就不得不需要抽更多时间来手动检查机器预测结果。在机器学习领域,我们有一些能评估分类器分类性能优劣的指标,这里我们先回顾两个概念:
精确率(Prcision):被分类器判定为正类的样本中,真正属于正类样本的比例
召回率(Rcall):被分类器正确判定为正类的样本数占正类样本总数的比例
精确率越高,召回率越低;反之,召回率越高,精确率越低。而平衡精确率和召回率的指标就是F-bta(Fβ)。这里β的取值意味着两者在分类器性能评估中的相对重要性,在疟疾诊断这个问题中,Ariza设β=2,即最小化假阴性的重要性是假阳性的2倍。
细胞开源数据这个WbApp能成功的关键是Ariza幸运地找到了一个优质数据集,里面包含27,幅经医学专家手动注释的单细胞图像,感染的/未感染的各占一半。这些细胞来自名患者,每四名患者中有三名患有疟疾。图像都分割自显微镜视野原始图像,而且都是手机拍摄,没有用需要连接到显微镜的特制相机。