米兰·(milan)中国官方网站-港大张清鹏 Nature 子刊最新研究:AI 结合血液多组学,提前 15 年预测心血管疾病风险
于血汗管疾病预防中,一个持久存于的难题是:很多疾病于病发前已经于体内暗藏多年,但要于初期正确判定一小我私家将来是否会同时面对多种血汗管疾病危害,其实不轻易。
以往的危害评估重要依靠春秋、血压、血脂等通例临床指标,或者多基因遗传危害评分。然而血汗管疾病往往是一个持久蜕变、可能同时呈现多种终局的历程,单一指标或者针对于单一疾病的猜测方式,很难周全反应真实危害。
跟着年夜范围人群行列步队及高通量份子检测技能的成长,研究者发明血液中的卵白质及代谢物可以或许更直接地反应身体当前的心理状况以和疾病进程。这些份子旌旗灯号不仅遭到遗传因素影响,也会随情况及糊口方式变化,为持久危害评估提供了新的信息来历。
于此配景下,由中国香港年夜学数据科学研究院和药理与药剂学系副传授张清鹏领衔的研究团队,基在 UK Biobank 年夜范围前瞻性人群数据,开展了一项多组学信息与人工智能相联合的研究。
研究团队再也不局限在“一病一模子”的思绪,而是将卵白组及代谢组信息纳入同一框架,同时评估多种血汗管疾病的持久危害。相干结果以《AI-based multiomics profiling reveals complementary omics contributions to personalized prediction of cardiovascular disease 》为题发表在 Nature Co妹妹unications,为血汗管危害研究提供了一种更总体、也更切近真实人群的研究路径。

论文地址:https://www.nature.com/articles/s41467-026-68956-6
用血液多组学信息,体系评估多种血汗管疾病危害这项研究的焦点发明是:于传统临床指标的基础上,引入血液多组学信息,可以显著晋升对于血汗管疾病持久危害的猜测能力,并且这类晋升于多种血汗管疾病中都体现患上不变一致。
研究基在 UK Biobank 的持久随访数据,采用分阶段的方式构建及验证模子。研究团队提出了 CardiOmicScore 框架,别离使用血液中的 2,920 种卵白质及 168 种代谢物,练习了两类人工智能模子,并由今生成为了两种疾病特异性危害评分:基在卵白组的 ProScore 及基在代谢组的 MetScore。
与传统只针对于单一疾病构建的危害评分差别,这两种评分是于统一模子中同时纳入多种血汗管疾病举行练习,体系性地捕获了多种血汗管疾病之间的共性生物学特性和其各自的份子差异,终极会为每一一种疾病别离天生对于应的危害评分。于随后纳入约 2.4 万名基线时未患血汗管疾病的验证人群中,研究者体系评估了这些危害评分的猜测效果。

(图1. 研究设计与阐发流程。a. 研究人群;b. 模子开发流程;c. 模子机能评估。)
成果显示,纵然不依靠任何传统临床指标,ProScore及MetScore自己就已经经具有较强的危害辨认能力,可以或许于疾发病生前十年以上发出预警旌旗灯号。此中,基在卵白组的ProScore猜测效果最为不变,其区别高危害与低危害人群的能力(C-index于0.69-0.82之间)较着优在多基因危害评分(C-index于0.52-0.60之间),于部门血汗管终局中靠近经常使用的临床危害模子。基在代谢组的MetScore体现(C-index于0.64-0.74之间)略弱在ProScore,但总体仍优在多基因危害评分。雷峰网(公家号:雷峰网)
于真实人群中,这些多组学评分也能清楚区别差别危害程度,辨认出更易发生血汗管事务的个别。不管是卵白组还有是代谢组评分,高危害人群于随访时期发生血汗管疾病的几率始终显著高在低危害人群,并且这类差异于六种血汗管疾病中均一致存于。

(图2. MetScore 与 ProScore 对于血汗管疾病危害的区别能力。a. 按MetScore分层的保存几率;b. 按ProScore分层的保存几率;c. MetScore及ProScore与血汗管疾病危害的联系关系强度。)
进一步阐发发明,多组学信息于现有临床评估基础上能提供分外价值。不管模子中已经包罗几多临床信息,只要插手卵白组或者代谢组评分,猜测效果城市较着晋升,此中卵白组评分带来的改善最为凸起,代谢组次之,而多基因危害评分的晋升相对于有限。这注解,多组学旌旗灯号反应的是传统临床查抄难以直接捕获的份子层面危害。

(图3. 多组学信息对于血汗管疾病的猜测机能。a. 模子的判别能力;b. 插手多组学信息后基线临床模子猜测机能的变化。)
从现实运用角度看,插手多组学信息后的模子猜测成果不变靠得住,猜测危害与真实事务发生率高度一致,不会体系性高估或者低估危害。于多种模仿的临床决议计划场景中,这种模子显示出更高的潜于收益,有望于削减没必要要干涉干与的同时,更早、更正确地辨认真实的高危害人群。

(图4. 血汗管疾病猜测模子的校准能力及净收益曲线。a. 校准曲线;b. 净收益曲线。)
为了理解模子“为何如许猜测”,研究者经由过程 SHAP 要领进一步阐发了模子最依靠的份子特性。成果显示,一些临床上早已经熟知的指标仍旧是焦点猜测因子,例如与心脏负荷相干的 NT-proBNP 及 NPPB 卵白,以和反应肾功效及养分状况的肌酐及白卵白。
于此基础上,模子还有辨认出了一批具备潜于价值的新型生物标记物。于卵白组中,GDF1五、MMP十二、FASLG 及NEFL 显示出较强的猜测能力;于代谢组中,谷氨酰胺、脂肪酸、糖卵白乙酰基(GlycA)以和多种脂质相干份子一样具备主要作用。
这些份子于差别血汗管疾病中的体现其实不彻底不异,为深切理解血汗管疾病的繁杂份子机制,以和摸索新的干涉干与靶点提供了线索。这些份子的作用模式,与心肌应激、炎症反映及代谢紊乱等已经知病理历程高度一致,申明模子确凿捉住了血汗管疾病的要害生物学旌旗灯号。

(图5. 血汗管疾病危害猜测中具备代表性的要害代谢物及卵白质。a. 要害代谢物;b. 要害卵白质。)

(图6. 代谢物及卵白质于血汗管疾病危害猜测中的相对于孝敬。a. 代谢物的猜测孝敬;b. 卵白质的猜测孝敬。)
基在年夜范围人群数据的研究设计与模子验证这项研究依托 UK Biobank 年夜范围前瞻性行列步队开展。研究采用了“先开发、再验证”的严谨设计:起首使用只包罗单一组学信息的年夜范围人群数据练习模子,此中包括约 22 万名具备代谢组数据的介入者及约 1.9 万名具备卵白组数据的介入者;随后,再于一组同时具有遗传、代谢及卵白信息、且基线时没有血汗管疾病的 2.4 万名个别中举行自力验证。这些人群的中位随访时间约为 15 年,使研究可以或许充实不雅察血汗管疾病的持久发生历程。雷峰网
研究重点存眷了六种常见且临床承担较重的血汗管疾病。所有疾病终局均经由过程病院住院记载及灭亡挂号信息举行确认,确保告终果判断的靠得住性及一致性。随访时间从基线评估最先,一直连续到疾发病生、灭亡、掉访或者随访竣事。
于数据层面,研究整合了三类要害信息。遗传危害经由过程既往全基因组联系关系研究中已经验证的遗传变异构建,用来反应个别的天赋易感性;代谢组数据来自血液样本,涵盖脂质、脂卵白、氨基酸以和炎症相干代谢物,可以或许反应机体当前的代谢状况;卵白组数据则一次性检测了近 3,000 种轮回卵白,笼罩炎症、免疫、代谢调控及血汗管布局重塑等多种要害生物历程。
于此基础上,研究团队开发了一套名为 CardiOmicScore 的人工智能模子框架,别离针对于卵白组(ProNet)及代谢组(MetNet)信息构建危害猜测模子。该框架的一个主要特色是,它既能进修多种血汗管疾病之间的共通生物学特性,也能同时捕获每一一种疾病独有的份子旌旗灯号。模子终极输出的是持续的危害评分,而不是简朴的“有病或者没病”,是以更合适用在持久危害评估。
于验证阶段,研究采用了严酷的自力测试计谋,确保模子于新的人群中依然有用。模子机能不仅经由过程经常使用的猜测正确度指标举行评估,还有联合了校准阐发及决议计划曲线阐发,体系查验其于真实临床利用场景中的靠得住性及潜于价值。
此外,研究还有对于模子举行了深切注释,阐发哪些详细的卵白及代谢物于危害猜测中起到了要害作用。这一步使患上模子的猜测成果可以或许与已经知及潜于的生物学机制相对于应,而不是逗留于“黑箱猜测”的层面。
一个可连续扩大的血汗管危害评估模子框架从研究意义上看,这项事情为血汗管疾病危害猜测提供了一种新的总体框架。研究清晰注解,仅依靠传统临床指标或者遗传信息,很难周全反应一小我私家将来的持久血汗管危害;而血液中的卵白质及代谢物,可以或许更直接地反应身体当前的心理状况及疾病进展历程。将这些信息体系性地整合起来,可以更正确地猜测将来血汗管事务的发生。
于临床运用层面,研究提出了一种更高效的危害评估方式:经由过程一次血液检测,同时评估多种血汗管疾病的持久危害。这类要领打破了传统“一病一模子”的做法,更切近真实临床中多种血汗管危害往往同时存于的环境,也为将来开展更精准、更高效的危害筛查提供了可能。
于精准医学的配景下,研究进一步凸显了卵白组及代谢组信息的怪异上风。与相对于固定的遗传危害差别,这些份子可以或许反应情况、糊口方式及康健状况的综合影响,是以更合适用在动态危害评估及初期干涉干与,为血汗管疾病的一级预防提供了新的科学依据。
此外,经由过程对于模子的注释性阐发,研究不仅验证了传统的 NT-proBNP 等既往已经知的血汗管相干生物标记物,还有经由过程AI展现了一批潜于的新份子线索。这些成果有助在加深对于血汗管疾病份子机制的理解,并为将来生物标记物开发、药物靶点发明以和医治计谋优化提供标的目的。
从更久远的角度来看,这项研究展示了一种具备优良扩大性的医学人工智能研究范式。跟着将来进一步整合影像、心电图等多模态数据,这种模子有潜力成长为更周全的血汗管危害评估东西,为临床决议计划提供越发个别化及前瞻性的撑持。
-米兰·(milan)中国官方网站




