English

队列数据平台

全生命历程全病程专病大数据队列

全生命历程全病程专病大数据队列

Whole Life Course whole course disease Big Data queue
2016年山东大学健康医疗大数据研究院在山东省卫生健康委员会牵头下,成立了“山东省健康医疗大数据科技创新平台”,以“发病率高、病死率高、致残率高、医疗费用高、科技支撑作用高”的相对独立病种为研究重点,首期建成的9个专病队列,成功申请了山东省或国家重点研发计划项目。2017年山东省卫生健康委员会启动了“山东省健康医疗大数据科技创新联盟”申报工作,依托该平台吸纳我省具备条件的三级甲等医院、疾病控制中心、高校、科研院所等共同参与,共同承担各重点疾病重大专项研究任务,共有 220个单病种队列联盟积极响应。经遴选,2018年确定在90种疾病(领域)点击下载附件进行培育,每个病种设计规模达10万例。
山东大学健康医疗大数据研究院-山东省卫生计生委文件
山东大学健康医疗大数据研究院-健康医疗大数据采集
每个队列汇聚2011年以来的全电子病历数据,同时链接外部数据,完成5万-10万例以上规模的回顾性病例数据汇聚。启动并维护前瞻性队列,完成新发病例注册、病程全量数据导入、跟踪服务随访数据对接。使用前置数据库ETL、给定标准接入接口、FTP传输采集数据。数据来源包括人口学、基本公共卫生服务、医保、死因监测、疾病监测、病案首页、新生儿出生登记、孕产妇管理、职业健康体检、老年健康体检、重点疾病高危人群体检、药品流通、生活习惯、个人穿戴设备等。建立标准化生物样本库及生物实验室。用于鉴定、验证药物分子靶点,研究发病机制,疾病相关分子标记物筛选,分子分型与个性化治疗等。



由研究院与队列联盟依托单位共同成立“专病队列联盟管理中心”。管理中心负责对汇聚的数据进行实时信息化随访、建立并维护专病队列、按照队列建设技术规程编制专病队列共享数据集。为各专病队列建设与管理、高通量组学检测、研究设计与分析、课题申报及论文撰写等提供技术培训和服务。

使用区块链技术对数据所有权进行确认,并根据用户角色(资源管理人员、系统管理人员、科研人员)设定相应的权限,施行访问控制。建立数据备份机制,防止数据安全容灾;采用冷热交叉机构,冷数据文件存储,热数据内存数据库。数据库分为关系型数据库(Oracle、DB2、PostgreSQL、Microsoft SQL Server、Microsoft Access、MySQL、浪潮K-DB)和非关系型数据库(Key/value、列存储数据库、文档型数据库、图形(Graph)数据库)两种。制定数据存储云方案。建立数据管理制度,每位使用数据者均需签订保密协议,利用区块链技术,确保数据安全性。

专线构建统一VLAN环境,数据库环境与各个表结构、数据字段后,对同库数据表做垂直拆分,同一张数据表做水平拆分,改造读写分离的大数据,统一分布式中间件层,MPI改造应用层,融合区块链做存证与监管并对数据操作设计进行总体布局,形成多中心全生命历程全病程专病大数据云队列并建立数据共享机制。联盟内部,各单位之间数据共享;联盟与队列管理中心之间数据共享;此外,数据可对外(保险公司等其他先关行业)实行有偿共享。

山东大学健康医疗大数据研究院-分布式数据库