English

成果展示

基于生物组学大数据的系统流行病学分析方法体系

System Epidemiological Analysis Method System Based on Big Data of Biomics

在跨组学大数据关联分析技术方面, 在国际上首次提出了基因-基因共关联(gene-gene coassociation)概念及其理论框架,所构建的以线性/非线性典型相关和偏最小二乘算法为核心的整体基因关联及其共关联效应统计推断方法体系(CCU、KCCU、PCA-BCIT、KPCA-LRT、PLSPM-based statistic、mPLSPM statistic、iBVS、Pathway Effect Measures(PEM))以及基于因果图理论的马尔科夫毯(Markov Blanket)条件独立准则,提出的组学标记筛选的重复钓鱼策略(MB-based Repeated –fishing strategy,MBRFS)和方法均是国际首创。据此所研发的跨组学大数据关联分析技术,也无疑是我国自主知识产权的精准医学关联分析技术。发表了 10 余篇 SCI 论文。

在生物标记网络构建及网络差异比较技术方面,提出的从统计学和系统生物学的双重视角,审视生物网络“节点”与“边”共变特征,采取“结构拆分→数理整合”的研究策略,以及所构建的融合网络“节点”、“边”和“方向”差异信息的统计量(PEM、NetDifM、WNES)均属国际首创。1)构建了基于路径系数连乘积之差的致病通路识别检验统计量 PEM,为系统流行病学中致病通路识别提供了新方法。2)针对无向网络的特征,采用“节点信息与边信息整合得分”的融合策略,构建了具有理论分布的网络组间差异检验的统计量 NetDifM,为系统流行病学无向网络比较提供了新方法。3)针对有向网络的“边的方向性差异”,借助于“生物群体家系谱图中,后代子孙越多的个体对生物群体的繁衍贡献越大”的生物学现象,巧妙地定义了网络内上游节点对下游节点的调控权重,构建了“节点”、 “边”和“方向”差异融为一体的有向网络比较的统计量 WNES,提供了有向网络比较的新方法。4)基于非参数联合密度估计,实现了从网络中筛选出对疾病或结局有贡献的非线性交互效应。基于非线性交互效应所构建的疾病判别预测模型优于现有统计模式识别方法。

在生物标记介导的疾病预测和筛查方面,构建了网络结构驱动的生物标记筛选及疾病预测模型。①在贝叶斯分层模型框架内,构建了基因网络拓扑先验驱动的贝叶斯生物标记筛选模型,为全外显子测序的 GWAS 基因组数据分析提供了新方法。②提出了利用网络结构信息提高模型筛检能力的创新建模策略,证明了忽略网络结构信息势必损失判别能力,为提高疾病筛检模型的判别能力提供了新思路。③将预测因子与疾病表型之间的网络结构信息嵌入到竞争风险模型内,构建了网络结构驱动的疾病风险预测模型,提高了模型的预测准确性,为疾病健康管理提供了新方法。

在识别精准诊疗靶点作用通路的因果推断技术方面,模仿实验研究的流程,仿照上游河流汇集是造成下游河水增加的水文因果关系,提出的“诊疗干预→组学生物标记靶点→诊疗效果及疾病预后”因果通路识别及其效应估计的因果图模型以及因果通路识别及其效应估计的统计量(PSEM),为国际首创,将成为我国自主知识产权的精准医学分析技术。

上一条:疫情防控平台(省、全球范围)成果展示

下一条:大数据技术驱动的心脑血管全程式健康管理智能系统