TCGA癌症临床研究数据资源全面介绍---癌症研究领域的全谱!

2022-01-31 12:47 来源:信阳妇科医院

2006年,肿突起症基因组左概要(The Cancer Genome Atlas, TCGA)原计划以多形患态中空恶患态肿突起(GBM)、肺鳞状肝细胞肿突起(LUSC)和卵巢浆液患态囊腺肿突起(OV)开始为期3年的自贸区建设项目,2009年~2015年全面展开。到建设项目上半年,TCGA网络分析工不作者已刻画了33种肿突起症型式10,000余则有高血压的原子特患态,并下定义了很多原子甲型。TCGA构成的临床分析关键特患态代注记众所周知的原始数据抽取。为确保于是以确应用于于这些具基因组特患态的海量临床分析原始数据,除此以外TCGA顺利完成一批重大成果,发注记在CellPress母公司的期刊。

本文对4年初5日发注记Cell上的一文顺利进行编译。文中阐述以OS(总穴居期)、PFI(无实质性近隔)、DFI(无患近隔)和DSS(哮喘特别存活)为四个主要临床分析结果终点站的TCGA蓝绿肿突起症临床分析原始数据天然资源(TCGA-CDR)规范化化元原始数据,并假定取而代之了每种肿突起症型式的终点站应用于于建议。TCGA临床分析原始数据可从基因组原始数据共享空近(GDC)人民网流媒体,所有的原子原始数据在流媒体。临床分析原始数据和原子原始数据应用于于都只的条码骨架,便于高血压的临床分析原始数据和结果显示原子原始数据构建。

TCGA蓝绿肿突起元原始数据原始数据流特患态

左图1A为临床分析原始数据构建和系统患态原理及4个主要临床分析终点站引申和分析的流程左图,对33份初始备案和97份后续原始数据文件,共33种肿突起症型式111,60则有肿突起症高血压的原始数据顺利进行了处理方式。注记1为每个TCGA原始数据流的基本特患态。按原发结果显示根据原子特患态崭露头角每个原始数据流,皮肤上黑色素突起(SKCM)的原发和集中于灶两种型式都有,其它极少数的原发与集中于型式也有分析。

左图1. 临床分析原始数据构建和系统患态原理及4个主要临床分析终点站引申和分析流程左图

注记1. TCGA 蓝绿肿突起原始数据流特患态

临床分析结果终点站OS、PFI、DFI和DSS

总穴居期(OS)很不可忽视,优点是下定义OS政治事件时模糊患态最很低。但应用于于OS不作终点站有可能遏制临床分析分析,因为非肿突起临终时因不一定能反映出取而代之生物学、波及患态或对疗法加重。应用于于OS或即可更长的随访一段时近;很多临床分析试验中的,通常采行相对于随访一段时近很短的DFI或PFI。针对现有TCGA临床分析原始数据,要认识到MLT-临床分析随访近隔在波及患态肿突起症型式结果的不可忽视患态,因为有可能几年内就辨别到临床分析政治事件,在被害从前已出取而代之现患情患或实质性。对波及患态占优势的肿突起症型式,高血压在数十乃至几十年后患,随访期近有可能无法辨别足够政治事件以支持确实结果供合理。该系统患态的目的是安全检查TCGA蓝绿肿突起临床分析检测的相对于优势和太很低,指导今后的系统患态和不致随访近隔一段时近太很低等缺陷。

系统患态全部TCGA临床分析原始数据后,论断如下:在原始数据可得到时,OS、PFI及DFI相对于精确,但都只情况只能大约DSS。左图1B为33种相异肿突起症型式的OS K-M斜率。尽管穴居系统患态不是TCGA主要要能,都只肿突起症型式穴居斜率与过去分析有所不同穴居终点站的并存分析基本有所不同,GBM、OV(2008, 2011)和很低级别中空突起(LGG)(2015)的TCGA结果就是最好则有证。PFI、DFI和DSS的K-M斜率见左图1C–1E。

左图1 B-E临床分析原始数据系统患态

基于每种肿突起症型式4个终点站的辨别一段时近计算平均随访一段时近及政治事件或安全检查的中的位一段时近(注记2)。所有的中的位随访一段时近为22.1个年初,但相异型式肿突起症该一段时近相似之处很大;GBM和急患态髓系白血患(LAML)最短约12个年初,而肾嫌色肝细胞肿突起(KICH)最低约48个年初。

注记2 相比之下中的位随访一段时近及4个终点站的政治事件与辨别中的位一段时近

自荐应用于于的临床分析结果终点站

临床分析结果终点站都只远大于分析要能、政治事件生产量、原始数据流大小和结果原始数据很低质量。将这些原理和研发的其它原理不作为对单个哮喘元原始数据的测试和足量安全检查,假定取而代之在每种哮喘型式中的应用于于每个结果终点站的建议及诱因(注记3)。每种肿突起症型式的穴居终点站即可要至少通过一个主要测试和足量安全检查才被接受。33种肿突起中的的13种应用于于全部4个终点站:膀胱尿路上皮肿突起(BLCA)、卵巢鳞状肝细胞肿突起(CESC)、结肠肿突起(COAD)、食管肿突起(ESCA)、肩部鳞状肝细胞肿突起(HNSC)、肾状肝细胞肿突起(KIRP)、肺腺肿突起(LUAD)、LUSC、OV、胰腺肿突起(PAAD)、肉突起(SARC)、胃腺肿突起(STAD)和子宫内膜肿突起(UCEC)。相反,从未一个终点站的有嗜铬肝细胞突起和副神经节突起(PCPG)。淋巴弥漫着大B肝细胞淋巴突起(DLBC)、LAML和胸腺突起(THYM)均一个终点站;剩余肿突起症型式2或3个终点站,但其中的一些持保留赞同。最确实的是PFI,可无保留地自荐给除LAML(无原始数据)、DLBC和KICH(慎重应用于于)和PCPG(不自荐)则有的4种。

注记3 终点站OS,PFI,DFI及DSS的分析与自荐应用于于

证明TCGA-CDR及案则有应用于

在乳腺肿突起分析中的,雌激素ER阴患态高血压临床分析穴居期结节病比ER+高血压差。分别用OS、PFI、DFI和DSS相当这两类高血压的穴居期(左图3A–3D;斜率上半年于10年随访一段时近,但应用于于整个元原始数据顺利进行系统患态)。单原因系统患态算出论断,应用于于PFI(p= 0.005)和DFI(p = 0.001)不作为临床分析终点站,TCGA中的ER+乳腺肿突起高血压比ER-高血压有更高的穴居期,但应用于于OS时两类高血压近不实际上相似之处(p = 0.097) 。此则有,两类高血压的DSS(p = 0.009)有特别是在相似之处,注记明DSS的潜在商业价参数。以上发现证实了PFI和DFI是特定型式乳腺肿突起原子分析的适宜终点站。

左图3 证明和应用于范则有

此则有还证明了波及患态GBM穴居结果终点站。TCGA中的GBM中的位OS为12.6个年初,介于此从前报道的规范化疗法的12.1个年初和规范化疗法为首替莫唑胺的14.6个年初相互近。中的位PFI是6.1个年初,介于此从前报道的规范化疗法5个年初和规范化疗法为首替莫唑胺的6.9个年初相互近。无论如何,TCGA元原始数据OS和PFI政治事件一段时近与文献明确。再次印证OS和PFI不作为GBM原子分析的临床分析终点站效度。

用Cox比则有高风险转回静态确定高期(III、IV期)相对于很低期(I、II期)肿突起症高血压的高风险比(HR),证明4个终点站的TCGA-CDR原始数据。由于DFI下定义与其它结果的下定义不明确,对自荐应用于于OS、PFI和DSS的14种型式肿突起症相当logHR(注记3)。随后均对符合Cox比则有高风险论断的哮喘顺利进行统计数字(左图3E–3G)。结果注记明,14种型式肿突起症中的,除近皮突起(MESO)、PAAD和葡萄膜黑色素突起(UVM)则有,高期对比很低期HR在3个自荐终点站OS、PFI及DSS上显着偏高。采行以此类推结果显示的Wilcoxon秩和检验,当应用于于PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)校准时,logHR有特别是在相似之处,算出论断哮喘实质性和穴居终点站在HR上实际上系统误差;OS与DSS相互近从未特别是在相似之处(p = 0.106)。对2个logHR参数的规范化误顺利进行成之加权平均确定Pearson特别系数, 由logHR大约的3种结果有极特别是在于是以特别:PFI和OS特别系数0.96(95%大约量[CI]:0.77–0.99),PFI和DSS为 0.95(95%大约量:0.76–0.99),OS和DSS为0.90(95%大约量:0.61–0.98)。这些特别患态潜在支持临床分析20世纪用PFI,后期用OS和DSS想到终点站。

除了构建原子原始数据,还尝试系统患态首次疗法后无患患与非无患患究竟出取而代之现相异的取而代之政治事件。TCGA-CDR中的29类肿突起症接收者用于克服该问题,纳入高血压从诊疗到顺利完成首治并达到无患状况至少存活3个年初。以LUSC为则有,有289则有无患患和41则有长期非无患患,NTE率共五21.8%和68.2%。用Cox比则有高风险转回静态,发现在非无患患中的NTE高风险特别是在高于无患患(HR = 6.68,95% CI = 4.25–10.51,FDR调整q参数<0.05)。在另则有21种肿突起症型式中的也有完全相同结果(注记4)。余下7种中的从未辨别到这些相似之处。我们也在分析究竟每个静态都符合比则有高风险论断,其中的有两个不符合,即可要分析一段时近相反及多变量静态来寻找诱因。

注记4 非无患与无患患NTE发展对比

TCGA从全球数百个客运站抽取确诊,为克服临床分析原始数据相异客运站近的可比患态,即可顾虑原始数据完整患态、和高血压特患态等。对每种哮喘而言,我们对比了从前两名透过确诊数最多的的组织来源客运站(TSS)与所有其它TSS的同种哮喘及4个结果终点站(注记5)。

注记5 对来自从前两位TSS的每个肿突起症型式分析结果顺利进行相当

对于GBM等兼具波及患态的,从前两位TSS(#1和#2)的发患童群与其它TSS相对于于完全相同的有OS、PFI和DSS,因政治事件太少难以系统患态不自荐DFI想到终点站。BRCA等较很低波及患态,利器自荐应用于于PFI和DFI,但建议慎重用OS或DSS分析。TSS #1的临床分析原始数据转化成不太好的OS和DSS,但从未辨别到PFI相似之处;另则有,注记面上TSS#1有更高的DFI结果,均出取而代之现3则有 DFI政治事件。这种注记里不一的现象注记明该客运站的结果原始数据即可大幅度分析。另一上都,TSS #2的4个终点站结果与其它地方明确。

这个恰当的结果相当注记明,当从特定结果系统患态整体TCGA的临床分析原始数据时,即可要顾虑TSS的具体内容接收者。由于比率、有系统/评定及疗法等原因影响相异TSS患患童群的终点站结果,TSS可以不作为这些和不完全临床分析注释等其它未校准相似之处的替代。

潜在的夹杂原因、竞争性结果的

高风险及静态论断

对临床分析穴居终点站系统患态来说,建议应用于于所处理方式的全部临床分析原始数据。但相对于于原子/基因组原始数据的构建系统患态,要忽略两个上都。首先,自荐赞同基于基线穴居静态,以原子甲型不作预见q细分结果显示集,有有可能破坏结果统计数字的特别是在患态相似之处。因此,从面对面关联的TCGA原子原始数据或甲型TCGA-CDR结果原始数据中的算出取而代之的论断即可在并存的元原始数据中的大幅度证实。

第二,我们建议均应用于于原发的原子原始数据,因为高血压初诊时,不可忽视一段时近接收者等也就是说的临床分析原始数据已抽取相对于完整。皮肤上黑色素突起(SKCM)在TCGA型式中的极其特别,470则有中的均103则有原发,其余296则有为原发渐进淋巴结集中于,68则有远端集中于。这与并不多抽取到集中于突起的其它TCGA肿突起症型式形成鲜明对比。SKCM集中于突起并不多带有也就是说的原发,而其它TCGA肿突起症型式尽管并不多有集中于突起,但都带有也就是说的原发结果显示。因此,对于SKCM结果的特别患态,建议只应用于于极小生产量的原发确诊,尽管SCKM淋巴结集中于的III期确诊可不作为并存总括顺利进行分析。

在应用于于取而代之构建的TCGA-CDR元原始数据时,还即可要忽略:潜在混淆原因、竞争性结果的高风险及静态论断。

夹杂原因

夹杂原因实际上但被排除在静态之则有时,误差有可能很低估或很低估真实。如在乳腺肿突起的种族相似之处分析中的,非裔与黑人高血压相互近实际上不可忽视的基因注记达相似之处,然而根据原子甲型顺利进行调整后,这种相似之处特别是在降很低甚至消失。治果也是潜在的夹杂原因,当接收者可给予时应适当顾虑调整。疗法未知时,比率、诊治的医院及诊疗年数等规范化疗法不作为替代接收者能降很低外误差。对这上都的决断建模,帮助应用于于标志物结节病分析建议报告(REMARK)。

竞争性结果的高风险

测出DSS、DFI和PFI终点站时,要对从未经历不可忽视政治事件且无患的被害高血压顺利进行审批。在这种情况,如果论断高血压从未其它临终时因,那她/他最终仍有可能临终时于肿突起症指征。然而,在大约疗法等预见q对继发患态肿突起症或心血管哮喘等非Index肿突起症被害高风险的预见能力时,该论断并不可取。

静态论断

应用于Cox比则有高风险(PH)静态不能安全检查PH论断。除少数案则有则有,大都只静态都符合Cox PH论断,但即可大幅度聚焦这些病例以找出取而代之背离论断的诱因,从而对HR想到出取而代之更于是以确的大约。尽管已经为清理原始数据和借助付出取而代之了不小帮助,但仍实际上不可忽视的应用于于容许,会面时TCGA临床分析原始数据都不能明了这些容许。

首先,TCGA主要是为原子分析设计,刚开始确诊都只来自多个机构带有适宜库存的组织的未疗法原发确诊,因此这些确诊不构成连续患态。此则有,对于每种相异型式/分析,随访原始数据从未并存抽取。同时,临床分析原始数据抽取的一些规则在过去不得不随着一段时近的推移而改变。TCGA - CDR不构成肿突起症疗法史,并非所有确诊都被注释。因此,系统患态特定型式或甲型的疗法取材比起统计数字原始数据患态蓝绿肿突起系统患态。当高血压顺利进行具体内容疗法时,给与能用DFI和PFI终点站有效系统患态。

其次,TCGA结果显示临床分析随访根据当地诊所的一段时近注记,有可能为哮喘或特定部位的患和患童不可忽视生命状况的历史记录,因此从未TCGA自行决定的临床分析随访原计划,均假定取而代之建设项目主要强调的原子特患态。

最后,几乎所有TCGA得到的结果显示和基因组及原子原始数据来自取而代之诊高血压原发的单个切片,由此转化成的基因组和原子原始数据不会在空近或一段时近任何上都明确捕获代注记另一高血压结果变量的异质患态。该问题不是TCGA类同的,任何静态原发患态分析都实际上。

展望

这项工不作是有史以来第一次全面行之有效处理方式TCGA蓝绿肿突起临床分析原始数据。由此转化成的TCGA-CDR的结果终点站与并存非TCGA分析结果明确,概述该天然资源在空从前规模的临床分析尺度上透过了生物观测取而代之视角。也要认识到TCGA-CDR的内在应用于于局限及关键患态指导和自荐赞同。已经极其明晰,人类哮喘将来大规模的原子分析不能行之有效抽取临床分析患理、疗法和转归政治事件原始数据,以坚持最低规范化的临床分析分析。尽管有其局限,TCGA-CDR透过了规范化化元原始数据,以及完整的4个临床分析结果终点站导出取而代之,并克服了很低质量问题,从而在蓝绿肿突起和患态状水平上顺利进行转化分析。将来生物信息学的融合将减低结果相互近的可比患态,更高地解释和支持以此类推。

参考原始数据

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
未满足医疗需求:当今美国十大致死营养不良
脱口而出的JAMA发表一篇评论统计当今澳大利亚入选为被害状况。对于年长者前十名依序是是缺血性心脏染病(20.3%)、阿尔茨海默染病(8.3%)、肺炎(7...[详细]
2022-05-10
月经不调的症状 8个表现帮你认识到大姨妈
甜蜜你有否同妊娠期心率不表征?同妊娠期顺延或月内了呢?那就或许是同妊娠期不调了哦。甜蜜每同月一次的同妊娠期某种程度以28天左右为一个心率,如...[详细]
2022-05-05
警惕!16岁少女长期服用避孕药,尿毒症住进ICU……
因为 翌年经不调、成年人一年多前在厦门一家医院治疗法 一直注射黄体酮和达英35 16岁的女孩大姐(化名) 没想到导致了膀胱癌竟然没命达英35是啥?据...[详细]
2022-05-04
怎么让月经快点来 这五种方法很有效率
女性朋友都有一个迟于周期,有时候,这个周期都是比较稳定的,但是也有很多女性迟于来的不是很准时。那么,怎么让迟于快点来呢?迟于推迟是什么可...[详细]
2022-05-03
详谈慢性子宫内结膜炎的症状有哪些
慢性输卵管内临床表现是常用的妇科性疾病,可分为急性和慢性呼吸道。是国际上的慢性内置呼吸道。这样的导致如果不及时的机芯治疗,就但会避免瞬...[详细]
2022-05-02
女人来例假时,符合“经量充足,周期规律”,说明子宫健康
大家都想到,到了一定的年龄之后,男同性恋便会来排卵期,它的预见到不光都是着男同性恋的生殖脑部仍未成熟期,通过排卵期也能够看出来男同性恋...[详细]
2022-05-02
产检很顺利完成,33周子宫突然破裂,肚子里都是“血块”!隔离手术室里上演了一场生命竞速
今年32岁的小凡虽然是第一胎,但已经是第四次男婴了。12翌年24日傍晚5点左左边,男婴33周的小凡开始觉得左边眼部隐痛,然后慢慢地加重并用到了呼吸...[详细]
2022-04-28
医院保安暴打送医急救医生,让“医德”很受伤 ?!
导语:近日,一段取名为“空军部队总的医院保安中都枪120救护眼科医生”的视频在在线传播后下来,但卫报成了亮点。从视频中都(却说可以看出,6名...[详细]
2022-04-27
什么原因造成的盆腔炎出血
子宫颈炎出血主要是因为急性的子宫颈炎所引起的,患儿多亦会引致下腹部的肿胀,还亦会并不需要地引起腰骶部的肿胀的致病。子宫颈炎是比较类似的...[详细]
2022-04-26
  • 地区医院
  • 医院联盟