•
循证研究与临床转化·方法学 •
GBD数据库的数据提取方法与流程
屈彦1,王天一2,杨津3,4,张军3,4,吕军3,4
基金项目:国家社会科学基金一般项目(16BGL183)
作者单位:1 710061 西安,西安交通大学第一附属医院神经内科;2 712046 咸阳,陕西中医药大学公共卫生学院;3 710061 西安,西安交通大学第一附属医院临床研究中心;4 710061 西安,西安交通大学医学部公共卫生学院
通讯作者:吕军,E-mail:lujun2006@xjtu.edu doi:10.3969/j.issn.1674-4055.2019.09.04
【摘要】疾病对人健康的危害始终是人们普遍关注的问题,疾病负担是指疾病、伤残以及早逝对生命健康、社会经济方面的损失和影响,准确掌握全球疾病负担的现状和发展,对促进人类健康和经济社会发展具有重要意义。GBD数据库是了解全球疾病负担最重要的数据库,它涵盖了最全面的疾病、风险、死亡及与疾病相关的伤残对健康造成的负担,因此掌握GBD数据库的使用方法非常必要。该数据库是一个开放的状态,感兴趣的研究者可以申请其中的数据进行相关研究,本文旨在对该数据库的申请方式以及数据的提取方法进行介绍。
【关键词】全球疾病负担;GBD数据库;申请;数据提取【中图分类号】R4
【文献标志码】A 开放科学(源服务)标识码(OSID)
GBD database application and data extraction methods and processes Qu Yan *, Wang Tianyi, Yang Jin, Zhang Jun, Lyu Jun. *Department of Neurology, The First Affiliated Hospital of Xi'an Jiaotong University, Xi'an, 710061, People's Republic of China.
Corresponding author: Lyu Jun, E-mail: lujun2006@xjtu.edu
[Abstract ] The harm of disease to the health of the population has always been a common concern. The disease burden refers to the loss and impact of disease, disability and early death on life health, s
ocio-economic aspects, accurately grasping the current status and development of the global disease burden, and promoting humanity. Health and economic and social development are of great significance. The GBD database is the most important database for understanding the global burden of disease, covering the most comprehensive diseases, risks, deaths, and the burden of disease-related disability on health. Therefore, it is very necessary to master the use of the GBD database. The database is an open state, and interested researchers can apply for the data to conduct related research. This paper aims to introduce the application method of the database and the method of extracting the data.
[Key words ] Global Burden of Disease; GBD database; Application; Data extraction
一直以来,人们对疾病危害人类健康的问题普遍关注,准确掌握全球各种疾病的负担,对了解疾病的危害程度和发展规律,提高卫生服务效率,促进居民健康和社会、经济发展具有重要意义[1,2]。
1988年,在世界卫生组织(WHO)和世界银行(World Bank)支持下,由美国比尔和梅琳达盖茨基金会资助,美国哈佛大学公共卫生学院开始对全球疾病负担(GBD)进行研究,随后由美国华盛顿大学健康测量和评价研究院牵头成立了GBD研究组专门对此开展研究[3-5]。全球疾病负担是一项全面的健康损失研究,旨在捕捉疾病和损伤负担的复杂模式;根据年龄、性别、地区及不同的时间点来定量包含死亡
、残疾、发病、生活质量下降及疾病造成的经济损失等内容,概括起来主要包括健康和寿命损失、经济损失以及除此
之外的其他损失[6-9]。我们通过对GBD公开数据库的研究,将其使用方法做如下总结:1 方法
访问工具:在M i c r o s o f t E d g e ,I n t e r n e t Explorer 11,Google Chrome,Firefox或safari等浏览器中,访问/gbd-results-tool。
1.1 查询数据 GBD数据库中包含包括所有GBD 病种、风险、病因学、损伤、自然损伤和后遗症综合征;衡量全球疾病负担的指标包括:死亡(deaths)、寿命损失(YLLs)、残疾寿命(YLDs)、残疾调整寿命(DALYs)、患病率、发病率、预期寿命、死亡概率、健康预期寿命(HALE)、产妇死亡率(MMR)和总暴露值(SEV);提取的数据指标(单位)包括:数量、比率、百分比、年份、死亡概率;可提取的数据年份为:1990~2017年所有措施的年度结果及所有GBD年龄组;性别可选择:男性、女性、或两者总和;研究地区分为:GBD超级地区、地区、国家、选择次国家单位和自定义地区(世界卫生组织地区、世界银行收入水平等)。
使用浏览器的控件指定查询参数,结果显示
在控件下方的表格和折线图中。基本的选项有三个:“single”、“change”、“PoD”代表“单年数据”、“年龄
段”、“死亡概率”,根据研究需要先选择一个基础项,进入相应的衡量指标查询,如位置、年龄、性别、病因等。每个衡量指标的顶部网格中的控件主要是下拉菜单(图1)。有两种方法可在下拉菜单中选择:①单击并滚动:单击向下箭头按钮(或在菜单正文中滚动),系统会弹出相应的选项,然后选中所需值的选框。②自动填充:直接在对话框内输入特定值或者关键词的名称,就会弹出相应信息,然后选中它下方的选框(图2)。如果要清除任何下拉列表中的选择,可衡量指标的对话框的右侧单击“X”标志,一次性清空所有选择(图3)。
单击“永久链接(Permalink)”按钮(图7)。出现“永久链接”框时,单击“复制”按钮将链接保存到计算机的剪贴板中。将链接粘贴到,文本文档或您可以保存和检索它的其他位置(图8)。这样可避免下次查询时再次输入相关关键词,特别是在某些网络无法下载结果时,可发送到其他网络环境下进行查询下载。这是非常重要的,因为有些单位的网络会有某些网站的访问和下载限制。如果想要下载查询结果:单击“下载CSV(Download CSV)”按钮(图9)按照下载选项提示。GBD网站下载的数据统一默认的格式是“CSV”格式,该格式可以用“Excel”打
开编辑查看。
图1
GBD结果工具用户界面:下拉菜单
图2
从下拉列表中选择值:滚动或自动完成
图3 清除已有选择
1.2 过滤结果 当初步查询筛选的结果较多,需要细分时,可以使用表格标题正下方显示的文本字段进一步过滤数据表中显示的结果,包括有10个对话框例如:度量、位置、性别、年龄、病因等(图4)。需查询哪个指标,只需在相应的文本字段对话框中键入所需值的名称,结果就会自动过滤。例如,检索的结果包括DEATHS(死亡)和DALYs(伤残调整寿命年)的估计值,如果想调出“DALYs”的结果,只需在“测量”字段中键入“DALYs”就可过滤出DALYs的结果(图5)。注意,如果查询结果行数超出工具数据表中显示的行数,则会警告“您的搜索结果要显示的记录太多”(图6)。为了避免这种情况,建议多设置一些关键词进行查询,或采取缩短时间段,减少地区数量、限定性别,精确到具体病因等措施。自动弹出网页
1.3 保存和下载结果
查询完成后,要保存查询,
图4
数据表过滤器
图5
通过“Measure”过滤结果
图6
要显示的记录太多时,会发出提示消息
图7
永久链接按钮
图8
永久链接框
图9 下载CSV按钮
点击下载CSV后GBD系统会提示:请选择参数提供地址并提交。一封包含下载文件链接的将随后发送到所提供的邮箱(图10)。“IDs”代表数据的代码,“Names”代表病因或者国家地区的名称,二者可选一个或全选,一般选择“Names”。
在邮箱收到一封系统发送的包含链接的邮件同时,系统还会弹出一个新的网页(图11),使用者可以通过邮箱内的链接进行下载,也可直接点击此网页上的“monitor progress”,新的网页(图12)再次弹出,此网页上的“IHME data download #1”为直接下载压缩包的链接,点击之后浏览器会自动下载所需要的数据包(图13),该数据包为压缩文件,需要使用相应的解压缩软件进行查看(图14)。至此整个文件全部下载完成。
图10 选择IDs或Names,并输入地址
图11 邮件输入成功,可以查看进程
图12 数据下载按钮
图13 浏览器自动弹出下载所需要的数据包
图14 使用解压缩软件打开下载的数据包
2 讨论
在“Base”菜单中提供三种选择:①Single:选择单一某年的数据,包括从1990至2017年任何一年或者多个年份的数据;②Change:选择某段年份范围的多年数据,包括三个时间段:“1990~2007”、“2007~2017”、“1990~2017”,这个选项有利于比较某指标的平均年变化趋势;③PoD(probability of death):选择死亡概率数据,死亡概率结果只能通过选择此数据来查询,这也是个单一年份的数据。在“Context”菜单中可以查询的指标结果:GBD病
种(Cause),风险(Risk),病因(Etiology)等。每个Context包括一组不同的度量。只有某些病种与每种风险,病因,损伤,性质损伤和后遗症有关。例如:要查看原因结果:在Context下拉列表中选择“Cause”,在“Measure”下拉列表中选择所需的度量,在病种下拉列表中选择所需的病种;要查看风险结果:在“Context”下拉列表中选择“risk”,在“measure”下拉列表中选择所需的度量,在risk下拉列表中选择所需的风险,在cause下拉列表中选择所需的相关病种;要查看病因学(Etiology)、损伤(Impairment)、伤害(Injury)、后遗症(Sequela Aggregate)、预期寿命(Life Expectancy),健康调整预期寿命(HALE)或合计暴露剂量(SEV)结果均可以此类推[10]。
需要注意的是:“人口(Population)”,“生育力(Fertility)”,“健康相关的可持续发展目标(Health-rel
ated SDGs)”和“生命表格(Life Tables)”也包含在上下文菜单中。选择任何这些项目,GHDx目录记录中将显示一个链接。这些记录包含CSV文件,其中包含这些项目的结果,单击“搜索”按钮以执行查询[11]。
要获取下载数据需要提供一个地址,并为文件提供包含ID(数字编码:例如101 429),名称(例如乳腺癌)或两者的选项。如果搜索结果超过500 000条,它们将被拆分为多个文件。根据输入的搜索关键词,数据申请最多需要几十分钟就能完成。同时还将收到一封确认,其中包含指向使用者可以查看请求状态的页面的链接。该过程完成后,该页面将包含文件的下载链接,使用者将收到第二封,确认下载已准备就绪[12,13]。
虽然GBD结果工具可以非常强大地查询和下载GBD结果,但包括许多搜索参数可能会导致一些问题:①具有大量参数的查询有时会导致文件忽略查询中指定的某些结果:特定年龄组,年份等。②同时查询所有位置以及许多或所有原因,年龄组,年份等时会出现数据不全;建议将查询分成较小的部分,首先搜索相对较窄的参数,然后逐步扩展参数查看结果是否出现在数据表中。③该工具不适用于Internet Explorer 10及更早版本。
参 考 文 献
[1] Ashkan Afshin,Patrick John Sur,Kairsten A Fay,et al . Health effects
of dietary risks in 195 countries, 1990-2017:a systematic analysis for the Global Burden of Disease Study 2017[J]. The Lancet, 2019,393(10184):1958-72.
[2] James S.L,Abate D,Abate KH,et al . Global, regional, and national
incidence, prevalence, and years lived with disability for 354 diseases and injuries for 195 countries and territories, 1990-2017: a systematic analysis for the Global Burden of Disease Study 2017[J].
Lancet,2018,392(10159):1789-858.
[3] Liang J,Li X,Kang C,et al. Maternal mortality ratios in 2852 Chinese
counties, 1996-2015, and achievement of Millennium Development Goal 5 in China:a subnational analysis of the Global Burden of Disease Study 2016[J]. The Lancet,2019,393(10168):241-52.
[4] Lancet T. GBD 2017:a fragile world[J]. Lancet,2018,392(10159):113-4.
[5] Akinyemiju T,Abera S,Ahmed M,et al. The Burden of Primary
Liver Cancer and Underlying Etiologies from 1990 to 2015 at the Global,Regional,and National Level[J]. JAMA Oncology,2017,3(12): E1-9.
[6] Stanaway JD,Afshin A,Gakidou E,et al. Global, regional, and national
comparative risk assessment of 84 behavioural,environmental and occupational,and metabolic risks or clusters of risks for 195 countries and territories,1990-2017:a systematic analysis for the Global Burden of Disease Study 2017[J]. Lancet,2018,392(10159):1923-94.
[7] 李茜瑶,周莹,黄辉,等. 疾病负担研究进展[J]. 中国公共卫
生,2018,34(5):777-80.[8] 徐张燕,张敏,崔亚萍,等. 疾病负担研究的发展与应用[J].中国肿
瘤,2013,22(8):638-43.
[9] 于石成,肖革新. 全球疾病负担研究—大数据分析应用实例[J]. 医
学信息学杂志,2013,34(9):12-6.
[10] Liu Z,Jiang Y,Yuan H,et al. The trends in incidence of primary liver
cancer caused by specific etiologies:results from the Global Burden of Disease Study 2016 and implications for liver cancer prevention[J].
Journal of Hepatology,2018,70(4):674-83.
[11] Stanaway JD,Reiner RC,Blacker BF,et al. The global burden of
typhoid and paratyphoid fevers:a systematic analysis for the Global Burden of Disease Study 2017[J]. JAMA,2019,19(4):369-81. [12] Krishnamurthi RV,Moran AE,Forouzanfar MH,et al. The Global
Burden of Hemorrhagic Stroke:A Summary of Findings From the GBD 2010 Study[J]. Global Heart, 2014,9(1):101-6.
[13] Institute for Health Metrics and Evaluation. GBD Results Tool User
Guide. Avaliable at:/sites/default/files/files/ Data_viz/GBD_2017_Tools_Overview.pdf.
本文编辑:孙竹
(上接1042页)
[12] NICE. Developing Nice Guidelines the Manual. 2017. Available
at:uk/process/pmg20/chapter/introduction-andoverview.
[13] SIGN. A guideline developer’s handbook. 2015Available at:
www.sign.ac.uk/sign-50.html.
[14] Ministry of Health Malaysia. Manual on Development
andImplementation of Evidence-based Clinical Practice Guidelines.
Putrajaya:MoH;2015.Available at:v.my/english.
php/pages/view/117.
[15] WHO. Handbook for Guideline Development. 2014. Avaliable at:
www.who.int/publications/guidelines/handbook_2nd_ed.
pdf?ua=1.
[16] Minds Guideline Center,Japan Council for Quality Health Care(2014).
Minds Handbook for Clinical Practice Guideline Development2014.
Available at: jp/.
[17] NCEC. Guideline Developers manual. 2013. Available at:www.
lenus.ie/hse/handle/10147/317480.
[18] PaldaVA,DavisD,Goldman J. A guide to the Canadian Medical
Association Handbook on Clinical Practice Guidelines[J].
CanadianMedical Association Journal,2007,177(10):1221-6. [19] Handbook for the Preparation of Explicit Evidenced-Based
ClinicalPractice Guidelines. 2001. Available at: www.health.
[20] Gagliardi AR,Brouwers MC,Palda VA,et al. How can we improve
guideline use? A conceptual framework of implementability[J].
Implementation Science,2011,6(1):26.
[21] Gagliardi AR. “More bang for the buck”:exploring optimal
approaches for guideline implementation through interviews with international developers[J]. Bmc Health Services Research,2012,12(1):404.
[22] Flodgren G,Eccles MP,Grimshaw J,et al. Tools developed and
disseminated by guideline producers to promote the uptake of their guidelines[J]. Nederlands Tijdschrift Voor Evidence Based Practice, 2016,14(4):11-3.[23] Volk RJ,Llewellynthomas H,Stacey D,et al. Ten years of the
International Patient Decision Aid Standards Collaboration:evolution of the core dimensions for assessing the quality of patient decision aids[J]. Bmc Medical Informatics & Decision Making,2013,13(S2):S1.
[24] Van d WT,Boivin A,Burgers J,et al. Clinical practice guidelines and
patient decision aids. An inevitable relationship[J]. Journal of Clinical Epidemiology,2012,65(6):584-9.
[25] Liang L,Abi JS,Gagliardi AR. Number and type of guideline
implementation tools varies by guideline, clinical condition, country of origin,and type of developer organization:content analysis of guidelines[J]. Implementation Science,2017,12(1):136.
[26] 尹梓名,吕旭东,段会龙. 基于临床指南的决策支持系统[J]. 中国医
疗器械信息,2015(3):1-5.
[27] 杨丽琴,康国胜,张亮. 基于临床实践指南的诊疗过程建模方法[J].
计算机集成制造系统,2017,23(5):1040-8.
[28] Peleg M,Boxwala AA,Bernstam E,et al. Sharable Representation of
Clinical Guidelines in GLIF: Relationship to the Arden Syntax[J].
Journal of Biomedical Informatics,2001,34(3):170-81.
[29] Peleg M,Boxwala AA,Ogunyemi O,et al. GLIF3:the evolution of a
guideline representation format[J]. Proc Amia Symp,2000,7(1):645-9.
[30] Forsetlund L,Bjorndal A,Rashidian A. Continuing medical education
meetings and workshops:effects on professional practice and health care[J]. Cochrane Database Syst Rev,2009,2:CD003030.
[31] Aakhus E,Granlund I,Odgaard-Jensen J,et al. A tailored intervention
to implement guideline recommendations for elderly patients with depression in primary care:a pragmatic cluster randomised trial[J].
Implementation Science,2015,11(1):32.
[32] Shiffman RN,Dixon J,Brandt C,et al. The GuideLine Implementability
Appraisal (GLIA): development of an instrument to identify obstacles to guideline implementation[J]. Bmc Medical Informatics & Decision Making,2005,5(1):23.
[33] DH Peters,T Adam. Implementation research:what it is and how to do
it. BMJ 2013,347:f6753.
[34] Peters DH,Tran NT,Adam AT. Implementation research in health: a
practical guide[J]. 2013.
本文编辑:孙竹
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论