Barrett食管

首页 » 常识 » 常识 » 全基因组异常DNA甲基化的多组学特征揭示
TUhjnbcbe - 2022/7/3 21:00:00

题目:Multi-omiccharacterizationofgenome-wideabnormalDNAmethylationrevealsdiagnosticandprognosticmarkersforesophagealsquamous-cellcarcinoma

发表时间:年2月25日

期刊:SignalTransductionandTargetedTherapy

影响因子:18.

作者及单位:北京协和医学院林东昕课题组

主要结论:这篇研究中,研究者基于全基因组甲基化等多组学联合的方法,在91例中国ESCC(食管鳞状细胞癌)患者的肿瘤组织和癌旁组织中发现DNA甲基化异常是ESCC发生发展的重要组成部分。该研究靶定了少数潜在功能性的甲基化CpG位点,能够将肿瘤与正常组织区分开或将患者分类为高低风险群体。使用这些CpG位点,研究者构建了DNA甲基化panel,用于ESCC的分子诊断和预后,并在多个公共数据集中验证。基于DMC的诊断和预后分组,对ESCC的临床护理具有潜在价值,为开发用于未来非侵入性肿瘤检测方法的靶向甲基化测定奠定了基础。

撰稿

蒋澜

校对

朱小龙

审核

吕坤、徐阳

食管鳞状细胞癌(Esophagealsquamous-cellcarcinoma,ESCC)占全球食管癌病例的80%,5年生存率30%。中国每年有,人死于ESCC。早期治疗比晚期治疗的预后更好,目前缺乏有助于早期诊断和预后的有效生物标志物。DNA甲基化异常在肿瘤发生发展中起重要作用。

年2月25日,来自北京协和医学院林东昕课题组在《SignalTransductionandTargetedTherapy》杂志发表了题为“Multi-omiccharacterizationofgenome-wideabnormalDNAmethylationrevealsdiagnosticandprognosticmarkersforesophagealsquamous-cellcarcinoma”的文章,作者通过调查异常DNA甲基化作为食管鳞状细胞癌的潜在诊断和预后标志物。比较91对ESCC和癌旁组织的全基因组甲基化位点,作者确定了35,个差异甲基化CpG位点(differentiallymethylatedCpGsites,DMC)并描述了其分布模式。整合相同样本的全基因组DNA和RNA测序数据,作者发现ESCC多个失调的转录因子和已识别的DMC具有特异的基因组相关性。使用DMC,作者在已有数据集和TCGA-ESCC数据集中开发了一个具有高精度的12个诊断靶标的panel,以及一个区分高危患者的4个预后靶标的panel。体外实验验证了4个靶标宿主基因的功能。这些结果共同为异常的DNA甲基化在ESCC发生发展中的重要作用提供证据。作者基于DMC的诊断和预后标志物对ESCC的临床护理具有潜在价值,为开发用于未来非侵入性肿瘤检测方法的靶向甲基化测定奠定了基础。

一、背景介绍

对于肿瘤检测,DMC被认为优于其他遗传特征,因为它们具有组织起源和肿瘤类型的特异性、癌变早期出现以及固定和体液样本随时间推移的相对稳定性。最近的一项临床研究证明了DMC标志物在处理循环无细胞肿瘤DNA(circulatingcell-freetumorDNAs,cfDNA)时的优越性。为了寻找潜在的基于DMC的标记,在大量样本中进行无偏选的全基因组筛选至关重要。同样重要的是与同一患者的其他相关基因组或转录组特征的关联测试,特别是基因表达谱。表观遗传异常经常扰乱基因调控;系统地研究这两个组学之间的相互作用将有助于查明生物学上健全的DMC标记。然而,以前的研究很少充分实现这两个步骤。早期的工作通常集中在少数异常甲基化的基因上,而不是进行全基因组搜索。最近的研究忽略了基因组和转录组学背景,即使在不同的患者组中对其进行研究,也缺乏匹配的多组学数据。例如,Talukdar等基于从非洲、亚洲和南美洲国家收集的多个ESCC样本的甲基化分析,开发了一个诊断性7-CpGpanel,根据TCGA-ESCC患者(主要是白种人)的基因表达对每个CpG标记物进行加权。迄今为止,尚未有研究对中国ESCC患者进行大规模甲基化组检测。

在之前的研究中,作者对91名中国ESCC患者的肿瘤和癌旁组织进行了全基因组测序和RNA测序。在本研究中,作者继续分析相同样本的全基因组DNA甲基化,并将DMC与各种基因表达改变以及ESCC特有的体细胞和种系变异相关联。基于这些结果,作者开发了一个由12个启动子/基因体DNA甲基化CpG位点组成的诊断模型,可在多个患者组中将ESCC与癌旁组织或正常食道区分。作者还开发了一个由4个启动子/基因体CpG位点组成的预后模型,可以将ESCC患者分为高危和低危组。正如文献或作者的体外实验所揭示的,已识别标记的宿主基因在ESCC发生发展进程中具有潜在的功能作用。总体而言,这项研究表明,ESCC基因组富含特定的DNA甲基化模式,这些模式可能是有效的诊断或预后生物标志物以及肿瘤发生发展的潜在介质。

二、结果解析

1.ESCC中DMC位点的概述

通过质控的,个探针,35,个(8.28%)在ESCC和癌旁组织之间发生差异甲基化(FDRq0.05,绝对中值甲基化差异

MMD

0.20;图1a),这些DMC中有56.54%(20,/35,)低甲基化(图1b)。高甲基化位点主要富集在18、19号染色体中(OR=1.32,P=3.60e-6,OR=1.11,P=4.25e-4),低甲基化位点富集在8号染色体中(OR=1.60,P=2.24e-68)。CpG岛(OR=1.66,P=1.00e-)和DNaseI超敏性位点(OR=1.77,P=6.06e-)中也富含高甲基化CpG位点,而低甲基化位点富含于opensea(OR=1.89,P=1.00e-)(图1e,f)。作者在启动子区域内发现了更多的高甲基化位点(图1e,f)。个(9.11%)启动子或基因体DMC的甲基化状态与其宿主基因在ESCC中的表达水平显著相关,使用RNA测序数据进行量化(

Spearman相关系数r

0.30,FDRq0.05)。这些DMC在7号染色体中的比例大多过高(OR=1.55,P=1.80e-14;图1g,h),并且比启动子和相邻区域更可能存在于基因体(OR=1.70,P=6.22e-;图1i,j)。

在ESCC肿瘤和癌旁组织之间差异表达的蛋白质编码基因中,90个下调基因和44个上调基因分别与其启动子区域的个高甲基化和70个低甲基化CpG位点相关;个下调和70个上调基因分别与其基因体中的个低甲基化和个高甲基化CpG位点相关(图2a,b)。我们检查了这些DMC相关基因与已知人类转录因子(transcriptionfactor,TF)之间的重叠,并发现高甲基化相关基因中的TF显著富集,包括与启动子超甲基化相关的90个下调基因中的32个(P=4.12e-15)。甲基化和70个上调基因中的39个(P=4.83e-27)与基因体高甲基化相关(图2b)。前一组(32个下调的TFs)主要是锌指基因家族的成员,例如ZNF(图2c,f),而后一组(39个上调的TFs)包括29个潜在的致癌同源框基因,例如HOXB13和DLX1(图2d,e,g,h),表明全基因组DNA甲基化异常可能导致多个TF失调,这些TF参与了导致ESCC发生发展的各种分子过程。

2.DMC位点与ESCC特异性遗传变异有关作者在9个先前确定的ESCC驱动基因FAT1、NOTCH1、JUB、MLL2、PIK3CA、TGFBR2、NFE2L2、NOTCH3和ZNF中发现了复发的启动子或基因体DMC(图3a)。作者发现高甲基化事件与RB1、NOTCH1、CDKN2A和PIK3CA基因的体细胞突变、3q26.32、7p22.3和14q13.3扩增以及2q22.1缺失显著相关。低甲基化事件与基因CREBBP和NOTCH3的体细胞突变、19q13.12扩增以及3p14.2和13q14.3缺失显著相关(图3b,c)。

3.DMC位点是ESCC的有效诊断/预后标志物

随机森林和LASSO应用于这些DMC,生成了12个DMC的模型。该模型在训练集中达到了98.33%的敏感性和93.33%的特异性(图4a),在验证集中达到了96.77%的敏感性和%的特异性(图4b)。作者还计算了受试者工作特征(ROC)曲线,训练和验证集中的曲线下面积值(AUC)分别为99.6%和97.1%(图4d,e)。使用外部数据集进行测试(包括TCGA-ESCC数据和其他GEO数据集(GSE和GSE),该诊断模型始终显示出高灵敏度、特异性和AUC(图4c、f),这表明了稳健性和普遍性。基于这些DMC的无监督层次聚类清楚地将ESCC与正常组织样本区分(图4g-i)。

作者通过对4个DMC的甲基化水平求和来构建预后模型,每个DMC在相应的Cox回归结果中由风险比加权。该模型将患者分类为具有高或低预后风险,其中高风险患者的中位OS明显短于其他患者(12个月对比33个月,Plog-rank=1.74e-4;图5a),HR为3.22(95%置信区间(CI)=1.84-5.62),根据年龄、性别、吸烟、饮酒和肿瘤TNM分期进行调整。将此模型应用于TCGA-ESCC样本产生了类似的结果:预测的高风险患者的中位OS显著短于低风险患者(23个月对比42个月,Plog-rank=0.;图5b),HR为4.25(95%CI=1.58-11.42)调整了年龄、性别和肿瘤TNM分期。作者进一步对不同肿瘤阶段的患者进行了生存分析,以评估预后分组的辨别能力。在样本中的早期患者(I和II)中,低风险组的OS时间比高风险组长(图5c),尽管统计数据略微显著(Plog-rank=0.;HR=1.62,95%CI=0.34-7.84),可能是由于样本量相对较小(n=24)。模型在TCGA-ESCC队列的早期患者中表现不佳(图5d)。对于晚期患者(III期和IV期),高危组晚期ESCC患者的中位OS时间为12个月,低危组为23.5个月(Plog-rank=4.70e-3;HR=2.69,95%CI=1.48-4.90;图5e)。同样,在TCGA-ESCC样本中,高危组和低危组晚期ESCC患者的中位OS时间分别为13个月和42个月(Plog-rank=0.;HR为24.11,95%CI=3.50-.18;图5f)。

4.已识别的诊断和预后标志物的功能意义

作者随后专注于标记宿主基因,其表达水平在ESCC样本中显著增加,并与相应DMC标记的甲基化水平相关,假设敲低这些基因的表达将在体外减少ESCC细胞的恶性肿瘤。选择在其启动子中具有DMC标记的MMP13、YEATS2和HOXC10以及具有基因体DMC标记的NECAB2进行功能实验。与匹配的正常组织样本相比,这四个基因在我们的ESCC样本中过度表达,并且表达水平与相应DMC的甲基化水平密切相关(

Spearman的r

0.30)。通过siRNA沉默YEATS2、HOXC10或NECAB2的表达可显著抑制ESCC细胞增殖、迁移和侵袭;沉默MMP13的表达显著抑制ESCC细胞迁移和侵袭,但不抑制增殖(图6a-h)。

三、亮点总结

本研究主要采用自测的基因组和RNA数据,进行二次数据挖掘,分析基因组的DNA甲基化模式,并结合公共数据集进行验证。ESCC基因组富含特定的DNA甲基化模式,可能是有效的诊断或预后生物标志物以及肿瘤发生发展的潜在介质。

原文链接:

1
查看完整版本: 全基因组异常DNA甲基化的多组学特征揭示