诺道医学首席数据科学家王则远博士受邀将在计算机国际顶级会议做学术报告
发布日期: 2019/03/22 浏览次数:
日前,诺道医学首席数据科学家王则远博士收到了来自2019年神经网络国际联合会议(International Joint Conference on Neural Networks,简称IJCNN)主办方的邀请,将在会议上分享其论文《Attention based Multi-instance Neural Network for Medical Diagnosisfrom Incomplete and Low Quality Data(基于注意力机制的多示例神经网络在不完整和低质量数据中进行医疗诊断)》。

IJCNN将于2019年7月在匈牙利布达佩斯召开,由国际神经网络协会(INNS,International Neural Network Society)和IEEE计算智能协会(IEEE-CIS,IEEE Computational IntelligenceSociety)共同举办,是计算机领域A类学术会议、神经网络及相关领域的国际顶级会议。会议旨在分享专家学者在深度学习、感知、机器人技术、神经科学、认知和脑结构方面的研究成果,会议内容主要涵盖神经网络相关理论与应用,从生物神经网络建模到人工神经计算都将是会议主题。王则远博士的论文提出了一种新的基于注意力机制的多示例神经网络,该方法可在真实世界的低质量数据集中进行有效信息的定位,然后基于有效信息进行疾病诊断。


图1 诺道医学首席数据科学家王则远
 
王则远博士是美国斯蒂文斯理工大学数据科学专业硕士,悉尼大学计算机科学专业博士,先后师从美国著名数据科学家David Belanger教授(IEEE大数据委员会联合主席,AT&T贝尔实验室首席科学家),国际推理算法著名专家Simon Poon。在2017法国巴黎-萨克雷大学((Université Paris-Saclay))举办的全球高校学生数据科学大赛(DataScienceGame,简称DSG)预赛中获得全球第8名、全美第1名的佳绩,决赛成功进入全球前20强。在诺道医学任首席数据科学家期间,主持开展了阜外医院国家心血管病中心高血压\脑卒中机器辅助诊断、上海交通大学医学院附属新华医院个体化用药、北京大学第三医院循证药学等多个项目的算法设计和数据分析工作。
王则远博士认为当前是医疗大数据的爆发期,各种医疗AI应用百花齐放,传统机器学习算法已难以满足真实世界研究的需求,例如svm、xgboost、随机森林、逻辑回归、决策树和前馈神经网络等,基本上都会遇到真实世界数据质量的限制。在临床实践中,每个患者都会有一系列的症状描述,医学诊断是先去定位有效症状,然后将其映射到一种或多种疾病。在以往的研究中,需要将患者数据以统一格式的存储在数据池中,并在特定的特征空间中进行特征选择和分类,从而得到诊断推理结果。然而,在大多数真实世界研究中此方法是不适用的,因为临床数据总是不完整和低质量的,例如数据不平衡、数据破损、数据非标准化、数据异质和数据噪音等,使其难以整理到统一的特征空间中。

王则远博士基于这一问题,提出了一种新的基于注意力机制的多示例神经网络,该方法可在低质量数据集中进行有效信息的定位,然后基于有效信息进行疾病诊断。它首先采用嵌入层,将每个病人的症状映射到多维嵌入空间中。随后通过多头注意力变换、instance-level多示例池化和bag-level多示例池化捕获不同症状之间的内关联性及其信息涵盖度从而进行最终的分类。此方法在中医和西医两个真实世界数据集上进行效果验证,实验结果表明,该方法在主要评价指标上大幅度优于基线模型。通过进一步的实验分析,此方法即使在数据集不平衡、非标准、不完整和大量噪音存在的情况下,也具有良好的稳定性和可靠性。此方法将可解释性与深度特征表达相结合,为疾病的真实世界研究提供了新的思路。王则远博士认为随着深度学习技术的逐步成熟和完善,未来将会在医疗人工智能领域大放异彩,从辅助诊断到疾病风险预警,从用药指导到不良反应预警,为患者带来更多健康福祉。

诺道医学一直聚焦真实世界临床数据的研究与应用,与海军军医大学长征医院药学部合作中标2018国家自然科学重点基金《基于临床真实世界证据的中药质量标志物的发现与确认》,与上海交通大学医学院附属新华医院、郑州大学第一附属医院、北京大学第三医院、北京医院、安定医院等多家大型三甲医院合作开展了包括疾病风险预警、个体化用药、不良反应预警在内的多个真实世界数据研究项目。