IBM Best Paper at MedInfo 2017
IBM谢国彤:认知医疗四大焦点,医药信息学顶会MedInfo2017优秀论文解读

【导读】在刚刚结束的 MedInfo 2017 上,IBM 中国研究院共发表了 8 篇论文。IBM 中国研究院认知医疗研究总监谢国彤向新智元介绍了研究院认知医疗的研究焦点。8 篇论文中,《针对房颤患者长期华法林用药的基于群的轨迹分析》获得了最佳论文第二名。我们请到了论文的第一作者郭世婧为大家做论文解读。

MedInfo 2017(第十六届世界医药健康信息学大会)刚刚在杭州闭幕,今年大会的主题是“基于医药信息学的精准医疗”。作为国际著名的健康和生物医学信息领域的盛会, MedInfo 在某种意义上也成为了新信息技术变革医疗健康产业的风向标。

本届大会上,我们看到 IBM 中国研究院在 MedInfo 2017 上共发表了 8 篇论文,涵盖了一系列技术进步,旨在从预防、诊断、治疗和患者参与(patient engagement)四方面帮助临床医生完成慢性疾病的日常管理。实际上,使用认知计算来改善中国医疗已成为 IBM 中国研究院的主要关注领域之一。

IBM 中国研究院认知医疗研究总监谢国彤

IBM 中国研究院认知医疗研究总监谢国彤对新智元表示,研究院的认知医疗聚焦解决一个问题:利用认知计算,重塑疾病管理。具体体现为:

1)疾病预防:基于精准的疾病预测,帮助医生和患者主动进行并发症的预防;

2)辅助诊断:自动解读医学影像,提高疾病筛查和诊断的效率;

3)精准治疗:利用真实世界证据增强临床指南,辅助基层医生进行个性化治疗;

4)患者管理:理解中文自然语言,自动对患者进行随访和患者教育。

从 IBM 中国研究院此次在 MedInfo 上发表的 8 篇论文,我们也可以看出 IBM 中国研究院在这一方向上所作出的努力:

1.《针对房颤患者长期华法林用药的基于群的轨迹分析》

Group-based Trajectory Analysis for Long-Term Use of Warfarin Therapy in Atrial Fibrillation Patients

2.《风险预测模型在危险因素取值未知患者中的应用:一种增量学习方法》

Applying Risk Models on Patients with Unknown Predictor Values: An Incremental Learning Approach

3.《基于聚类分析获取真实世界证据的医疗决策支持系统》

Gathering Real World Evidence with Cluster Analysis for Clinical Decision Support

4.《基于深度学习的患者中文相似问题检索》

A Deep Learning based Method for Similar Patient Question Retrieval in Chinese

5.《深度糖尿病专家:基于循环神经网络的降糖药物处方学习》

Deep Diabetologist: Learning to Prescribe Hypoglycemic Medications with Recurrent Neural Networks

6.《从数据的角度分析个人健康的自我管理》

Personal Health Self-Management in a Data Perspective

7.《利用机器学习方法预测ST段抬高型心肌梗死患者的院内死亡率》

Models to Predict In-hospital Mortality for ST Elevation Myocardial Infarction Patients

8.《利用结局驱动的相似性分析寻找精准人群: 房颤案例研究》

Precision Cohort Finding with Outcome-Driven Similarity Analytics: A Case Study of Patients with Atrial Fibrillation

其中,《针对房颤患者长期华法林用药的基于群的轨迹分析》(郭世婧,李响,杜昕,刘海峰,谢国彤)获得了大会最佳论文第二名。

下面是本篇论文的第一作者郭世婧所做的论文解读。

用药轨迹分析模型和预测模型的建立

房颤病人有很高的发生脑卒中的风险。对于房颤病人,华法林是一种广泛被医生接受的、用来预防脑卒中的长期口服药。然而,房颤病人对华法林的用药在一段时间内呈现什么特征并不是很明确,比如病人是一直吃药,还是先吃药后停药,还是其他更复杂的轨迹曲线特征。

另外,一段时间内不同的服药轨迹对脑卒中的发病会有什么影响?不同服药轨迹的病人会不会有什么其他不同的特征——比如服药轨迹不同的人会不会在年龄上存在差异?进一步来讲,能否根据病人的特征数据来预测病人未来会倾向于哪种用药轨迹?这些问题都需要进一步的探索。

该项研究针对以上问题设计了研究步骤和方法,共分为以下 5 步:

华法林用药的基于群的轨迹分析的流程图

第一步,依照选择标准选择研究人群;

第二步,应用基于群的轨迹分析模型,依照用药曲线的相似性进行分群,进而挖掘人群的用药轨迹曲线。这一步使得具有相似用药曲线的人分到一群中,并用一条用药轨迹来代表着这一群人,从而实现了用几条特征曲线来清楚地展示所有人群的用药特征;

第三步,对影响未来用药轨迹的基础特征进行筛选;

第四步,针对不同用药轨迹组的人群,挖掘对比人群特征以及对脑卒中结果的影响;

第五步,建立对用药轨迹的预测模型。

结果显示出华法林用药在人群中呈现出三条不同轨迹。按轨迹将人群分为 3 组后,可观测出与脑卒中的发生有着密切关系。

此外,不同组人群在年龄、病情、用药史上呈现出了不同的特征。预测模型共筛选出了 29 个特征,多项逻辑回归模型在测试数据集上呈现出较好的预测结果。

三组的 AUC(曲线下面积)分别为:0.757,0.616 和 0.748。

与会的 IBM 中国研究院认知医疗团队

avatar