第三节 中国肿瘤全基因组关联研究现状
由于人群遗传背景的差异,欧美国家的GWAS成果并不完全适用于我国。因此,我国的一批科学家也开展了针对中国人群的GWAS。虽然较国际同行相比起步较晚,但也使得我们可以充分学习和借鉴欧美国家GWAS的经验和教训,从中总结出一套适用于我国的GWAS策略。在这样的背景下,自2010年起,众多课题组的协同合作,共同努力,使得中国GWAS也取得了十分丰硕的成果。特别近一两年,我国许多肿瘤相关GWAS成果接连发表在国际顶级遗传学杂志 Nature Genetics上,标志着我国肿瘤遗传易感性的研究达到了国际一流水平。本节以近年我国科学家发表的肿瘤相关GWAS为例,对中国GWAS研究现状做一简单介绍。
一、食管鳞状细胞癌GWAS
食管鳞状细胞癌(简称食管癌)是一种常见的消化道恶性肿瘤,位居我国死亡率的第四位。我国是全世界食管癌高发区之一,全世界每年新发病例约30万,其中超过一半发生在我国。此外,食管癌还具有起病隐匿的特点,大多数患者就诊时已经是中晚期,5年生存率仅有20%。因此,开展食管癌的GWAS对中国具有特别重要的意义。
2010年,郑州大学医学院王立东教授课题组和美国国立卫生研究院(National Institutes of Health,NIH)的Philip Taylor教授课题组同时报道了在我国河南食管癌高发区进行的食管癌GWAS结果,前者发现位于 PLCE1和 C20orf54的两个SNP与食管癌的易感性相关 [18];后者也发现了 PLCE1上的SNP与食管癌易感性相关,但未发现 C20orf54基因上的SNP与食管癌易感性相关 [19]。
为了发现更多的食管癌遗传易感位点,中国医学科学院肿瘤医院的林东昕教授课题组在2011年也开展了食管癌的GWAS [20]。他们运用Affymetrix 6. 0的高密度芯片对2031例食管癌患者和2044例正常对照进行分析,对发现的相关SNP在4个独立样本(共包含3986例食管癌患者及4157例正常对照)中进行验证,最终发现了位于5q11、6p21、10q23、12q24、21q22的7个SNP与食管癌的易感性相关,在研究中他们既验证出了在之前两篇中国食管癌GWAS中发现的 PLCE1基因遗传变异与食管癌的相关性,还新发现了3个之前从未报道过的食管癌易感位点。此外,他们还发现位于12q24的3个SNP与吸烟和饮酒有明显的基因—环境交互作用。12q24这一区段中包含乙醛脱氢酶( ALDH2),最先在日本人的食管癌GWAS中发现与食管癌相关,他们在这一区段还新发现了2个SNP与食管癌的易感性相关。
为了更深入地挖掘GWAS数据,发现更多的食管癌易感位点,林东昕教授在上一个GWAS的基础上,对初筛阶段10 -7< P≤10 -4的SNP进行了扩大样本量(10 123例食管癌和10 664例正常对照)的验证,并进行了全基因组的基因-饮酒交互作用分析,完成了现今为止规模最大的食管癌GWAS [21]。在这项研究中,他们又发现了9个全新的食管癌易感位点,其中位于4q23、16q12. 1、17q21、22q12、3q27、17p13和18p11的7个SNP与食管癌发病风险呈现显著的边际效应(marginal effect)( P=1. 78×10 -39-2. 49×10 -11);而另外位于2q22和13q33 的2个SNP只以基因-饮酒交互作用方式与食管癌风险增高相关(P G×E=4. 39×10 -11和P G×E= 4. 80×10 -8)。林东昕教授还发现,含乙醇脱氢酶基因簇( ADHs)的4q23易感位点与饮酒有显著的交互作用(P G×E=2. 54×10 -7-3. 23×10 -2)。这项研究进一步证实了先前报道的12q24(含以醛脱氢酶基因)和4q23(含乙醇脱氢酶家族基因)的遗传变异与食管癌易感性相关,并且探索了这两个区段遗传变异与食管癌发病风险存在基因-环境交互作用。我们将 ADH1B 和 ALDH2两个基因上的遗传变异合并分析发现,携带两个风险基因型的饮酒者罹患食管癌的风险是非饮酒者的4倍。
之后,林东昕教授还将迄今为止GWAS发现的17个与食管癌易感性呈显著边际效应的易感位点以及8个与食管癌易感性呈基因-环境交互作用的易感位点联合分析,并加入性别年龄吸烟饮酒这4个非遗传因素,建立了食管癌发病风险的预测模型 [22]。我们通过联合分析发现,17个与食管癌呈显著边际效应的食管癌易感位点组成的风险加权评分模型(weighted genetic risk score,wGRS)提升了食管癌的发病风险约4倍( P= 1. 49×10 -164),8个与食管癌患者饮酒有交互作用的食管癌易感位点组成的风险加权评分模型则仅在饮酒者中提升了约4倍的食管癌发病风险( P=8. 76×10 -41)。由这25个食管癌易感位点及性别年龄吸烟饮酒这4个非遗传因素组成的食管癌预测模型,其ROC曲线下面积为70. 1%,比单独用非遗传因素建立的食管癌预测模型提升了7个百分点,证明GWAS发现的食管癌易感位点确实有助于建立更好的食管癌风险预测模型,为今后食管癌的筛查和预防提供了强有力的基础。
此外,林东昕教授还通过对1331例食管癌患者长达5年以上随访和全基因组关联分析,发现 SLC39A6基因5’-UTR的rs7242481 G>A变异与患者生存期差异相关,携带A等位基因的患者中位生存时间只有16个月,显著短于携带G等位基因患者的32个月。这一结果也在来自江苏和广州的共计1962例食管癌患者中得到了验证。为了确立SLC39A6基因变异与食管癌预后的生物学基础,他们还进行了一系列生化和分子生物学功能研究,发现G>A变异由于破坏转录抑制因子结合位点,导致 SLC39A6基因表达上调,促使食管癌细胞增殖和转移,因此携带A等位基因的患者预后不良。本研究首次表明 SLC39A6是促进食管癌进展的重要分子和预后标志,是食管癌潜在的治疗靶点 [23]。
二、胰腺癌GWAS
胰腺癌是一种恶性程度极高的消化道肿瘤,由于胰腺独特的解剖位置和功能,以及胰腺癌生长迅速和易浸润转移的生物学特征,其难以被早期发现,80%~85%的患者诊断时已经失去了根治性手术的机会。胰腺癌对现有的化疗和放疗等治疗方式不敏感,预后较差,5年生存率仅约5%,发病率和死亡率之比接近于1。因此,挖掘胰腺癌发病的易感因素对于胰腺癌的早诊早治至关重要。
林东昕教授课题组在2011年开展了首个中国人群胰腺癌的GWAS [24]。他们运用Affymetrix 6. 0的高密度芯片对1012例胰腺癌患者和2064例正常对照进行分析,对发现的33个相关SNP在来自全国16个省市25家医院的2603例胰腺癌患者和2877例对照中进行了验证,最终发现了位于21q21. 3、5p13. 1、21q22. 3、22q13. 32和10q26. 11的5个全新的胰腺癌易感位点,并且验证出了在欧美人群胰腺癌GWAS中发现的位于13q22. 1的易感位点。将发现的这些易感位点累加(cumulative)分析发现,携带5个或以上风险基因型的个体患胰腺癌的风险是不携带风险基因型的个体的6. 27倍。此外,通过检索开放数据库,他们对发现的易感位点进行了数量性状(eQTL)分析,结果显示位于21q21. 3的rs3742883与邻近的 BACH1基因表达量显著相关( P=7. 48×10 -9),提示该位点可能通过影响了 BACH1的表达而与胰腺癌的发病风险相关。
三、肺癌GWAS
肺癌是人类最常见的恶性肿瘤之一,位列我国男女肿瘤死亡率的第一位。欧美国家针对肺癌已经开展了许多GWAS,发现了一系列与肺癌相关的重要易感位点 [25-28],其中一些也适用于中国人群 [29]。探索是否存在我国独特的肺癌易感位点也是我国GWAS的重要研究方向。
2011年,南京医科大学沈洪兵教授课题组完成了中国首个肺癌GWAS [30]。该研究中,他们运用Affymetrix 6. 0的高密度芯片对2383例食管癌患者和3160例正常对照进行分析,对发现的18个SNP以及之前在欧美人群中发现的位于5p15. 33的SNP在6313例肺癌患者及6409例正常对照中进行验证,最终发现了位于3q28、5p15. 33、13q12. 12以及22q12. 2的6个与肺癌易感性相关的遗传位点,其中13q12. 12和22q12. 2是首次在中国人群中发现的全新肺癌易感区域。
为了进一步阐明肺癌遗传易感性及其与肺癌主要危险因素吸烟之间的交互作用,沈洪兵教授课题组将验证的样本量扩大到7436例肺癌患者及7483例正常对照,进而新发现了位于10p14、5q23和20q13. 2的三个显著性达到5×10 -8的全新肺癌易感位点,以及位于5q31. 1和1p36. 32的两个显著性接近10 -8的易感位点,其中1p36. 32、5q31. 1、5q32和20q13. 2四个位点影响肺癌的易感性与吸烟有显著的交互作用 [31]。同年,沈洪兵教授课题组还开展了单独针对肺鳞癌的GWAS [32]。他们分析了833例肺鳞癌及3094例正常对照的GWAS数据,并在2223例肺鳞癌患者及6409例正常对照人群中进行验证,最终发现了位于12q23. 1上的一个SNP只与肺鳞癌的易感性相关,显著性水平达到了1. 19×10 -10。
同年,美国国立卫生研究院(NIH)与亚洲多家单位合作,开展了亚洲非吸烟女性肺癌的GWAS [33]。他们分析了来自中国内地、中国香港、中国台湾省、日本、韩国及新加坡的共计5510例非吸烟女性肺癌患者及4544例正常对照的GWAS数据,并在1099例非吸烟女性肺癌患者及2913例正常对照人群中进行了验证,最终发现了位于10q25. 2、6q22. 2和6p21. 3的三个非吸烟女性肺癌易感位点。他们还验证出了之前发现的位于5p15. 33、3q28和17q24. 3的三个肺癌易感位点,并进一步证明了位于15q25的肺癌易感位点只在吸烟人群中显著增加罹患肺癌的风险。
除了以上与肺癌发病相关的GWAS之外,国内还有几项与肺癌放化疗敏感性、预后等相关的GWAS。林东昕教授课题组在2010年开展了针对小细胞肺癌铂类药物敏感性及患者生存期的GWAS [34,35]。他们分析了245例经铂类药物化疗的小细胞肺癌患者的GWAS数据,从中筛选出了与铂类药物化疗敏感性及患者总生存期相关的SNP,在武汉、南京等地区的小细胞肺癌患者中进行了验证,最终发现了位于 YAP1基因上的SNP与小细胞肺癌的生存期显著相关,功能实验也提示该SNP可以通过调节 YAP1的表达从而影响小细胞肺癌患者的生存情况。2012年沈洪兵教授课题组开展了非小细胞肺癌铂类药物化疗预后的GWAS [36]。他们分析了533例接受铂类药物化疗的非小细胞肺癌患者的GWAS数据,并在中国西南部的340例及美国麻省总医院的409例非小细胞肺癌患者中进行了验证,最终发现了5个与中国非小细胞肺癌患者生存期相关的易感位点,其中的2个也与欧美非小细胞肺癌患者的生存期相关。
四、肝细胞癌GWAS
肝细胞癌(简称肝癌)是我国常见肿瘤之一,死亡率位列我国癌症的第三位,全世界80%的肝细胞癌发生在我国,乙型肝炎病毒(HBV)感染是其主要的病因。但是,同样HBV慢性感染的人群,发展为肝癌的患者不到五分之一 [37],提示遗传易感性在肝癌的发生发展过程中起到重要作用。
我国肝癌GWAS起步较早,2010年贺福初教授和周钢桥教授开展的乙肝病毒相关的肝癌GWAS是国内最早的GWAS之一 [38]。在这项研究中,他们筛查了335例慢性乙肝病毒感染且罹患肝癌患者及360例慢性易感感染但未发生肝癌的对照组的GWAS数据,并在1962例肝细胞癌患者,1430例正常对照及159个核心家系中进行了验证,最终发现了一个位于1p36. 22的遗传变异与肝细胞癌的易感性相关,该区域内的 KIF1B基因可能是新的肝细胞癌易感基因。
2012年,由第二军医大学周伟平教授联合国内多家单位合作完成了第二项慢性乙肝病毒感染相关肝细胞癌的GWAS [39]。在这项研究中,他们分析了1538例慢性乙肝感染的肝细胞癌患者及1465例仅慢性乙肝病毒感染的对照的GWAS芯片结果,并经过了第一阶段2112例肝癌患者和2208例对照及第二阶段1021例肝癌患者和1491例对照的验证,最终发现了位于6p21. 32和21q21. 3的两个全新肝细胞癌易感位点,其中21q21. 3区域内包含 GRIK1基因,首次提示出谷氨酸代谢的信号通路可能在肝细胞癌的发生发展中起到重要作用。
2013年初,由复旦大学余龙教授开展的另一篇肝癌GWAS也发表在 Nature Genetics上 [40]。在该项研究中,余龙教授课题组分析了1161例肝细胞癌患者及1353例对照的GWAS芯片数据,并在来自中国六个地区的共计4319例肝细胞癌患者及4966例正常对照样本中进行了验证,最终发现了位于 STAT4和 HLA-DQ的两个全新的肝细胞癌易感位点。特别是 STAT4上的rs7574865,经过功能分析可以显著的调节 STAT4的表达,提示 STAT4通路与肝细胞癌的发生发展密切相关。
五、乳腺癌GWAS
乳腺癌是欧美国家研究最多的肿瘤之一,已经有许多GWAS发表 [41-45]。中国乳腺癌患者的病因、遗传易感因素是否与欧美国家一致是长久以来萦绕在肿瘤遗传学家心中的问题。
美国范德比尔特大学Zheng wei教授课题组与上海市肿瘤研究所、上海市预防医学研究院合作,在2009年发表了第一篇中国女性乳腺癌的GWAS [46]。他们分析了1505例乳腺癌患者和1522例正常对照的GWAS芯片数据,从中筛选出了与乳腺癌易感性最相关的29个SNP在两阶段共计5026例乳腺癌患者和2476例正常对照中进行了验证。最终,他们发现了一个位于6q25. 1的rs2046210与乳腺癌的易感性密切相关,该SNP位于雌激素受体 ESR1基因的上游,也进一步证明了乳腺癌的发生发展与雌激素受体之间的密切关联。
此后,Zheng wei教授课题组接连发表了三篇亚洲女性乳腺癌的GWAS,发现了一系列与乳腺癌易感性相关的SNP位点 [47-49]。他们首先在超过一万对的中国乳腺癌患者及正常对照中,验证出了之前在欧美人群中发现的位于16q12. 1的遗传位点,并进一步证明该位点也在亚洲其他国家的乳腺癌患者中起到同等重要的作用。之后,为了发现更多新的乳腺癌易感位点,Zheng wei教授课题组又在四阶段共计17 153例亚洲乳腺癌患者及16 943例正常对照中验证了49个之前从未报道过的乳腺癌易感位点,发现了位于10q21. 2的全新SNP与亚洲女性乳腺癌易感性相关。2012年,他们又再度扩大初筛和验证的样本量,在19091例亚洲乳腺癌患者及20 606例正常对照样本中,发现了一个位于 TAB2基因附近的SNP与乳腺癌的易感性相关。
此外,Zheng wei教授课题组还在来自上海的共计6110例乳腺癌患者中开展了乳腺癌生存的GWAS [50]。他们验证了在1950例乳腺癌患者中发现的与生存期相关的49个SNP位点,最终发现了两个与乳腺癌患者生存期显著相关的SNP,他们进一步在1145例美国乳腺癌患者中验证这两个SNP,也得到了相似的结果。
六、其他肿瘤GWAS
由曾益新院士课题组开展的鼻咽癌GWAS是我国最早的肿瘤GWAS之一 [51]。他们分析了1583例鼻咽癌患者及1894例正常对照的GWAS芯片数据,从中挑选了与鼻咽癌最相关的49个SNP在3507例鼻咽癌患者及3063例正常对照中进行了验证,发现了位于 TNFRSF19、 MDS1-EVI1、 CDKN2A-CDKN2B三个基因上的遗传变异与鼻咽癌密切相关。
由南京医科大学沈洪兵教授课题组和笔者所在课题组还共同开展了我国非贲门胃癌的GWAS [52]。通过对1006例非贲门胃癌患者及2273例正常对照人群的GWAS芯片数据分析,在3288例非贲门胃癌及3609例正常对照样本中验证了最显著相关的17个SNP,最终发现了位于5p13. 1和3q13. 31的两个遗传位点与非贲门胃癌的易感性相关。
由第二军医大学孙颖浩教授联合国内多家单位开展了中国首个男性前列腺癌的GWAS [53]。通过1497例前列腺癌患者和1008例正常对照样本GWAS芯片的初筛以及4484例前列腺癌患者和8934例正常对照样本的验证,他们发现了位于9q31. 2和19q13. 4的两个前列腺癌易感位点。其中位于19q13. 4的rs103294与 LILRA3基因的缺失突变呈现很高的连锁关系,并且也与 LILRA3基因的表达量显著相关,提示 LILRA3基因在前列腺癌的发生发展过程中可能起到重要作用。
由Zheng wei教授课题组联合中山大学、上海肿瘤研究所等多家单位合作完成了亚洲人群结直肠癌的GWAS [54]。他们分析了来自2098例结直肠癌患者和5749例正常对照人群的GWAS芯片数据,从中筛选出64个相关SNP在5358例结直肠癌患者及5922例正常对照人群中进行了验证。最终,他们发现了4个全新的结直肠癌易感位点,其中3个在上万例欧洲结直肠癌患者及对照人群中也被验证出来。
由新加坡国立大学刘建军教授课题组,联合林东昕教授课题组以及贾卫华教授课题组发表了首个中国人群B细胞型非霍奇金淋巴瘤GWAS [55]。他们针对253名中国B细胞型非霍奇金淋巴瘤个体和1438名对照进行了全基因组关联分析,随后又在另一组独立的1175 名B细胞型非霍奇金淋巴瘤个体和5492名对照人群进行了进一步的验证。我们在3q27区段BCL6基因和LPP基因之间,发现了一个新的易感位点rs6773854与B细胞型非霍奇金淋巴瘤和弥漫性大B细胞淋巴瘤(DLBCL)风险增高显著相关。但未发现rs6773854与T细胞和自然杀伤(NK)细胞谱系非霍奇金淋巴瘤相关,证明B细胞亚型和非B细胞亚型淋巴瘤之间存在显著的异质性。