2021大型人队列研究数据管理团体标准解读(全文)
摘要
精准医学已成为我国科学技术优先发展的重点战略,大型人队列的建设是人疾病防治的重要资源,其研究结果为个体化和精准预防提供科学证据。因此,如何规范化的建设大型人队列是上述工作的基础。中华预防医学会组织北京大学等单位撰写《大型人队列研究数据处理技术规范(T/CPMA 001-2018)》和《大型人队列研究数据安全技术规范(T/CPMA 002-2018)》两项团体标准。标准以"科学性、规范性、可行性、可推广性"为原则,提出了大型人队列研究在数据标准化技术、数据清理及质控技术、数据整合技术、数据隐私保护技术和数据库安全稳定性管理技术的原则和具体要求,以指导和规范我国已建立或拟开展的大型人队列、区域性人队列以及特殊人队列,促进国内科研水平的提升,增加国际影响力,最大程度的支持疾病防控的决策与实践。
近些年来,随着生物医学研究的深入和发展,流行病学研究证据在疾病和健康问题中的研究价值日益体现。作为大型人研究中证据价值最大、最可靠的研究资源,队列研究在流行病学病因学研究和疾病风险预测方面的价值也越来越受到人们的关注,国内外在人力、物力和财力等
方面的投入越来越大。然而,纵观我国队列研究的发展历史,起步较晚,规模较小,研究分散,项目执行期短,且缺乏长期稳定支持[]。
为全面落实《国家中长期科学和技术发展规划纲要(2006-2020年)》的相关任务,"精准医学研究"于2016年被列为优先启动的重点专项之一,旨在以我国常见高发、危害重大的疾病及若干流行率相对较高的罕见病为切入点,实施精准医学研究的全创新链协同攻关,构建百万人以上的自然人国家大型健康队列和重大疾病专病队列。
起草背景
大型人队列研究的数据量大、来源复杂、类型丰富。研究内容上既包括问卷调查、体格检查、影像学检查和生化指标检测数据,也涵盖研究地区宏观地理和气候学信息、遗传学数据、终点事件数据等。因此,规范、有效地进行数据标准化和数据清理,完善多维、动态数据库的质量控制、数据整合及安全稳定是队列研究建设的重要课题。目前国内尚未形成与队列研究数据管理工作相关的国标、行标或专利性文件,缺少基于大队列这类多源、异构数据集的规范,更缺少对数据建设后的进一步规范。
2016年,国家重点研发计划"精准医学研究"资助重点专项"大型自然人队列示范研究"项目(项目编号:2016YFC0900504)。该项目以中国慢性病前瞻性研究(China Kadoorie Biobank,CKB)项目[]十余年的成功建设经验为基础,建立大型人队列研究的规范化操作流程,制定人队列的建设标准。此次撰写并发布的两项团体标准《大型人队列研究数据处理规范(T/CPMA 001-2018)》[]与《大型人队列研究数据安全规范(T/CPMA 002-2018)》[](标准)就是对大型人队列研究的数据管理方面提出了标准和要求。
前期工作基础
国际标准舞包括CKB队列是我国迄今为止规模最大且全球领先的大型人队列,项目建设引入了国际先进的管理理念和技术手段,坚持标准化操作规范,实行全程计算机化管理。从现场数据采集到血样的登记、分装、储存、运输以及材料的供应和运输、交流通信、与死亡和发病数据关联等各个环节,项目通过专用软件系统进行规范化管理,为提高工作效率、同步和动态化的现场质量控制创造基本条件。由此可见,项目的管理模式和理念均处于国际先进水平,而且随着项目进行不同阶段,可以预见并解决大型队列研究的问题,这些实践经验可指导其他人队列的建设,提高研究质量和工作效率,创新项目管理运行机制。
在此基础上,CKB项目团队以国家科技支撑计划项目《区域人口健康大型队列适宜技术的标准化与应用》为依托,着眼于大数据时代及超大型队列研究不断发展的趋势,对大型队列基线调查中的各类信息和样本收集的规范化方式及流程进行了系统的梳理总结,出版了《大型人队列研究调查适宜技术》[]和《大型人队列研究随访监测适宜技术》[]两本专著,重点介绍了基于我国国情的大型人队列研究中主要慢性病发病、死亡监测的适宜技术及相应的技术规程。两本书稿的出版,对我国大型队列研究整体设计和实施各个环节中的标准进行了规范化要求,为国内不同水平的队列研究建设提供了示范和技术支撑,也为国家层面上的标准统一、数据规范和资源共享奠定了基础。
编写原则
本标准为首次制定,遵循"科学性、规范性、可行性、可推广性"的原则,根据国家数据标准化及信息安全相关法律、法规和法规性文件,行业标准及规范的要求,结合大型人队列数据库管理的规范化研究成果,以及现有队列建设的实践经验进行标准编制。
本标准旨在制定符合国情、满足目标人和地域特点、可操作性强、可推广的人队列建设的团体标准和规范化操作流程,指导其他人队列的建设,促进国内科研水平的提升,增加
国际影响力,最大程度的支持疾病防控的决策与实践。
团标内容
本次制定的两项标准规定了大型人队列研究在数据管理各个环节的基本原则和技术规范,适用于各级卫生行政部门、各级各类医疗卫生机构以及科研机构等规范开展大型人队列研究过程中与数据管理有关的工作。
两个标准的主要章节相似,包括范围、规范性引用文件、术语和定义、技术规范要求以及相关参考文献,其中技术规范的主要内容包括六个方面:
1.数据标准化技术:
结合数据利用要求,将数据按照相关行业的要求进行标准化,提出数据标准化的基本要求,介绍数据标准化的实施过程、数据库设计要求以及不同类型数据的标准化方法等一系列操作规范。
2.数据清理及质控技术:
结合大型自然人队列的多来源数据(包括现场调查数据、长期随访监测数据、组学数据等),从数据检查、问题处置和统计学监测三个方面制定有针对性的数据清理标准,并对数据质量控制提出要求。
3.数据整合技术:
根据数据的特点,规定了结构化或非结构化数据整合的基本过程,将多源异构数据整合到标准数据库中,便于数据挖掘及分析。
4.数据处理记录与报告:
数据管理要求对上述三个阶段所涉及的数据处过程、依据和结果进行详细的记录,并定期报告和存档。
5.数据的隐私保护:
根据伦理学的要求和现场工作的实践,通过加密和其他安全措施,保护受试者的基本利益。本标准规定了大型队列研究数据隐私保护的基本要求,提出了数据隐私的类型、数据隐私参与角及主要环节的隐私保护措施。
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论