培训报名 10周年所庆专栏 项目管理系统 邮箱 登录/注册
EN  |  中文

通讯 | 北大临床所高培研究员团队发表“采用机器学习模型改善心血管病风险预测的真实世界研究”新证据

来源:    发布时间:2023-12-04

2023年11月,欧洲心脏病学会(European Society of Cardiology, ESC)官方杂志《European Heart Journal - Digital Health》在线发表了北京大学临床研究所高培研究员团队利用“机器学习模型构建基于重复测量数据的心血管病风险预测模型”的最新研究成果。该研究针对中国鄞州电子健康档案研究(CHinese Electronic health Records Research in Yinzhou, CHERRY)项目中的不规则重复测量数据,构建了多个监督式机器学习模型,并与《中国心血管病风险评估和管理指南》推荐的China-PAR模型进行了比较,为现实场景下充分利用数字健康技术改善心血管病风险预测的准确性提供了证据。
 
传统的心血管病风险预测工具,仅能利用少数变量的单次测量信息;而现实世界场景中,广泛存在的电子健康档案数据,存在着种类丰富的各种变量及其多次重复测量信息。机器学习模型作为处理不规则重复测量数据的常用算法,能否用来改善心血管病风险预测的准确性仍需要更多证据支持。因此,该研究在CHERRY项目中选择了“年龄在40-79周岁,既往无心血管病史”的215744人,利用这些研究对象的重复测量数据(包括人口学信息、用药史以及血脂、血压、血糖和肾功能等临床常规检测信息),构建了基于极限梯度提升模型(eXtreme Gradient Boosting,XGBoost)和最小绝对值收敛和选择算子回归(least absolute shrinkage and selection operator regression,LASSO)的5年心血管病风险预测模型。结果发现,相比于传统的China-PAR模型,机器学习模型具有更好的区分度(C统计量为0.79),从风险分布上可以更加明显地区分人群是否发病,同时也表现出了较好的校准度;与China-PAR模型相比,在指南推荐的风险切点下(即5年风险大于5%为高危),XGBoost模型和LASSO 回归的净重分类改善指数为3.9%和2.8%,体现了新模型的临床应用价值。
 

针对该研究,《Circulation: Cardiovascular Quality and Outcomes》副主编Khurram Nasir教授团队在同期配发的《From data to wisdom: harnessing the power of multimodal approach for personalized atherosclerotic cardiovascular risk assessment》社论中高度评价,指出该研究充分利用了不规则重复测量数据,不仅获得了更好的区分度,而且改善了校准度和重分类能力,尽管这些指标的绝对差异较小,但应用于大量人群时产生的影响也不容小觑。未来研究应结合更多的非结构化的图像、文本数据等多模态信息,并且纵向测量的变化轨迹也可能为预测提供时间维度上的动态信息。最后,所有的数据与预测模型都应以提升健康服务质量为目的,因此该研究为充分利用数字健康技术改善真实世界心血管病风险预测的准确性奠定了重要的基础。

该研究由国家重点研发计划(2020YFC2003503)和国家自然科学基金(81973132)资助。

全文链接:https://academic.oup.com/ehjdh/advance-article/doi/10.1093/ehjdh/ztad058/7318170
社论链接:https://academic.oup.com/ehjdh/advance-article/doi/10.1093/ehjdh/ztad068/7429004

作者简介
高培,研究员、博士研究生导师。
现任北京大学公共卫生学院流行病与卫生统计学系研究员,北京大学临床研究所真实世界证据评价中心主任,重大疾病流性病学教育部重点实验室PI。2015年入选国家“引进计划”青年人才,2017年获首届北大医学青年科技奖,2018年获北京大学王选青年学者奖,2019年入选国家科技创新领军人才。共发表中英文论文85篇,累计影响因子891,其中以第一作者或通讯作者在Lancet, JAMA,BMJ,PLoS Med,Lancet Respir Med,Circulation等杂志发表论文共25篇。致力于健康数据科学与决策研究。现任中华预防医学会健康风险评估与控制专业委员会、健康测量与评价专业委员会副主任委员;中国医促会公共卫生与预防医学分会常委;中国预防医学会健康大数据与人工智能应用专业委员会常委;中国卫生信息学会统计理论与方法专业委员会委员;中华医学会糖尿病学分会委员;国家药品监督管理局医疗器械技术审评中心医疗器械技术评审专家。作为主要参与人参与制定了2020年国家药品监督管理局医疗器械技术审评中心制定的《真实世界数据用于医疗器械临床评价技术指导原则(试行)》等多个真实世界数据与证据研究的指导原则和技术规范。