第三节 肿瘤分子流行病学的主要研究内容

分子流行病学研究中最重要的内容是生物标志物(biological markers或biomarkers)的研究,肿瘤分子流行病学研究也不例外。狭义的肿瘤生物标志物是指一组包括蛋白质、生物化学分子、酶、肿瘤细胞的产物或机体对肿瘤应答的产物。广义的肿瘤生物标志物是指肿瘤细胞中癌基因或抑癌基因和其他肿瘤相关基因及其产物的异常表达所产生的抗原和生物活性物质,包括DNA、RNA以及蛋白质等;以及机体对恶性肿瘤的应答产生的一些生物活性物质和因子。1987年,美国科学院对于肿瘤分子流行病学研究中的生物标志物进行了较为详细的阐述,总体上可分为以下几类 [15]:外暴露(external exposure)标志、内暴露剂量(internal dose)标志、生物有效剂量(biologically effective dose)标志、效应标志(effect)、易感性(susceptibility)标志等(详见第三章)。目前,肿瘤生物标志物在肿瘤的辅助诊断、高危人群筛查、肿瘤监测、疗效评估以及预后判断等方面,正发挥着越来越重要的作用。
理想的肿瘤生物标志记物应具有特异性和实用性。依据不同类型的研究和不同的研究目的,可以选择不同类型的肿瘤生物标志物。若要研究暴露及其水平与肿瘤的关系,则选择暴露标志物;探讨暴露引起的生物学效应及其与肿瘤的关系,可选择效应标志物;研究易感性在肿瘤发生发展中的作用,则选择易感性标志;需要进行多方面的综合研究如基因环境交互作用等,就要选择多项(类)生物学标志物。在肿瘤研究领域,生物标志物可取材于肿瘤组织或正常组织,也可取材于血液和各种浆膜腔的病理性液体,如胸腔积液、心包积液等。需要注意的是,采取检测动物或者人的血、尿、组织中化学物质或其代谢物作为生物标志物有可能受到半衰期和接触时间等因素的限制。

一、环境致癌物暴露的检测及评价

20世纪以来,社会经济发展迅速,工业“三废”源源不断地排入环境,放射性物质、农药、人工合成的食品添加剂、医药、化妆品与化工日用品等不断进入日常生活。人类在享受经济社会发展和科技进步成果的同时,也面临着许多不可忽视的负面因素,如资源消耗加快、环境污染、生态环境破坏等。环境污染物质中大多含有致癌物质,例如,致癌芳香烃、苯并芘、致癌芳香胺、亚硝酸化合物、黄曲霉毒素等。另外,农药中的有机氯农药、重金属中的铬和镍等也都是强致癌物质。研究已表明,90%以上的癌症与环境暴露有关,特别是环境中的化学污染物可以直接或间接作用于DNA而引起DNA损伤,干扰或破坏DNA的复制或修复过程,进而诱发基因突变或染色体畸变,并最终导致细胞的癌变。
肿瘤分子流行病学对于环境致癌物的检测和评价主要包括以下几个方面:①测量环境及内源性合成致癌物的内暴露剂量;②探讨致癌物在体内的代谢过程;③确定致癌物与体内靶器官作用的生物有效剂量;④分析致癌物引起的机体功能性或结构性变化;⑤评价个体对于致癌物的易感性等。致癌物暴露导致肿瘤发生的不同阶段或过程,均可以选择不同的标志物进行检测。以烟草暴露为例,烟草中含有多种有害化学物质,在卷烟点燃时的高温下,烟草中的有机物同时发生蒸馏、干馏、热解、合成等反应,形成了大量的化合物,其中至少60多种可致癌。对烟草暴露进行检测和评价时,环境中的吸烟烟雾浓度可以作为外暴露标志;血或尿中的烟草代谢产物如可替宁(cotinine)浓度以及与多环芳烃(PAHs)有关的尿中的1-羟基芘(1-hydroxypyrene)水平可以作为内暴露剂量标志;香烟中的多环芳烃、芳族胺、亚硝胺等与细胞内的DNA相结合形成DNA加合物则是反映烟草暴露生物有效剂量的内在的指示剂;进一步的DNA断裂、基因突变和特定癌基因或抑癌基因的改变等是烟草暴露的效应标志;多环芳烃类致癌物的主要代谢酶CYP1A1的基因多态性则可以作为易感性标志。
值得注意的是,许多暴露因子至今尚无可靠的生物标志物,难以通过实验室检测来估计它们的暴露剂量。此外,还需要考虑到不同的暴露物在体内的半衰期可能不同,短的仅有几个小时,长的可持续数十年。体液(血或尿)中相关致癌物的半衰期相对较短,测定结果仅能表示目前的暴露水平,不能反映以往或长期的真实暴露状况。

二、肿瘤遗传易感性研究

不同个体在致癌物的吸收、代谢、活化、降解及对于DNA损伤修复的应答等等多个方面均存在差异,从而影响暴露与肿瘤发生之间的关联。易感性是能影响环境致癌危险性的因素,包括遗传、种族、年龄、性别和健康、营养状态等。以烟草与肺癌为例,烟草暴露致癌性已经无可争议,但大量暴露者中却只有少部分吸烟者(<20%)发生肺癌,说明不同个体对环境暴露的反应存在不同的易感性。目前,肿瘤易感性研究主要关注遗传易感性,即由个体遗传背景差异所导致的不同个体对同一肿瘤的易感程度。
遗传易感性生物标志可以是基因型的改变,如某个基因的缺失,染色体片段的拷贝数变异(copy number variation,CNV)或者单核苷酸多态性(single nucleotide polymorphism,SNP);也可以是生物学功能或者表型的改变,如代谢表型、DNA修复能力等。目前备受关注的遗传易感性标志物主要包括人群中罕见的、高外显率的癌基因/抑癌基因突变和人群中较常见、低外显率(危险度)的遗传多态性 [16]。前者多属肿瘤高发家族种系突变,如乳腺癌相关基因BRCA1/2的突变,突变基因携带者有较高的患癌危险性(30%~60%),环境影响较小,这类标志物在人群中通常比较罕见,一般小于1%,对总体人群发病的归因危险度也比较低。而常见的遗传多态性单独对疾病的贡献往往较小,外显率较低,相对危险度一般小于1. 3,主要通过多个变异或者与环境因素的协同作用增加个体对疾病的易感性,但人群分布的频率较高,一般大于1%,故人群归因危险度较高。随着人类基因组计划及环境基因组计划的完成,越来越多的基因及其遗传多态性被发现,这些基因大多行使机体的日常功能,多态性的改变可能影响其参与的多个生物学途径,如细胞分化、细胞凋亡、细胞周期调控以及DNA修复等,从而导致一系列异常健康状况的出现。
关联研究(association study)是进行肿瘤遗传易感性研究的常用方法,主要通过比较单核苷酸多态性等遗传变异的频率在肿瘤病例组和对照组中的差异,以发现与肿瘤相关的变异位点。过去10余年间,关联研究主要采用候选基因策略,即侧重已知通路/基因单核苷酸多态性(SNPs)的研究,在肿瘤遗传易感性方面进行了大量的工作,并取得了一系列研究成果。但由于早期研究固有的缺陷,如研究所涉及的基因及位点数较少,样本量较小以及检测方法通量较小等,不同的研究结果间不一致性较常见,重现性差。近年来,随着高通量基因分型技术的迅猛发展,全基因组关联分析已经被认为是目前肿瘤等复杂性状疾病遗传易感性分析的最有效工具,它突破了“候选基因”研究设计只盯着几个可能易感基因的局限性,为研究复杂疾病相关基因创造了前所未有的机遇。尽管目前在基因组关联研究结果指导下的肿瘤机制研究尚未取得令人瞩目的成效,但是新的肿瘤易感基因的确定有利于进一步深入研究肿瘤的发病机制,确定肿瘤治疗靶标,开发肿瘤治疗新药,为打破肿瘤研究和治疗的僵局提供了新的途径。

三、基因-环境交互作用

肿瘤的发生既有遗传的因素,又有环境的作用,而且两者往往并非互相独立,呈现出一定的交互作用,称为基因-环境交互作用(gene-environment interaction,GEI)。基因-环境的交互作用一般可以从统计学交互作用和生物学交互作用两个角度来理解。统计学基因-环境交互作用指的是对于含有不同基因型的个体,环境因素与健康效应间的统计学关联的程度或方向不同,或者对于处于不同环境暴露条件下的个体,基因型与健康效应间的统计学关联的程度或方向不同。生物学基因-环境交互作用指的是基因和环境因素彼此依赖、共同作用于一个生物学表型。统计学交互作用是一种表现形式,而生物学交互作用更关注于因果关联,强调的是“生物学机制上的交互作用”,是充分病因的共同参与。
多年来的研究表明:人类主要慢性病(包括肿瘤)的发生约有25%左右受遗传内因控制,其他75%左右则取决于个体行为与环境等外因及其与遗传内因交互作用的影响 [17]。因此,基因-环境交互作用的研究是目前肿瘤分子流行病学领域研究的热点。已有多种模型和统计学方法用于探讨肿瘤发生中的基因-环境交互作用。例如,Ottman(1990,1994,1995)根据基因与环境对疾病作用的形式,定义了5种不同的基因-环境交互组作用的模式。其中,第二种模式最受关注。在这种模式下,环境是导致疾病的原因,基因本身不直接导致疾病,但能够加强环境暴露的作用。最典型的例子就是着色性干皮病、紫外线辐射和皮肤癌的关系。过量的紫外线辐射暴露在一般人群中可增加患皮肤癌的风险,但干皮病患者修复紫外线辐射导致的DNA损伤的酶活性存在缺陷(如DNA修复基因的单核苷酸多态性导致修复酶活性下降),因而具有更高的发病风险。如果这些干皮病患者避免暴露于紫外线,就不会患有此种肿瘤 [18]
其他一些研究也揭示了一些基因多态性与环境因素在常见恶性肿瘤发生发展中的交互作用。如,美国人群的乳腺癌研究发现, XPD-751CC基因型仅在吸烟者中增加乳腺癌发病风险,交互作用显著;而 XRCC1(Arg399Gln和Arg194Trp)与PAH-DNA加合物、摄入蔬菜水果及摄入维生素C、α和β胡萝卜素等抗氧化剂均存在显著的交互作用 [19]。近年来,也有研究者利用乳腺癌GWAS的发现与已知乳腺癌危险因素开展了基因-环境交互作用研究。如2008年,Bhatti等率先利用GWAS结果,发现在乳腺癌的发生中,位于11p15的H19基因rs2107425多态位点与职业辐射暴露剂量之间存在显著的交互作用,而 MRPS30 rs930395多态与个体诊断性辐射暴露之间亦存在显著的交互作用 [20]。然而,这些研究结果的可靠性相当程度上依赖于样本含量、模型选择的合理性以及效应尺度的选择等。2010年,Travis等在一项包含7910例乳腺癌和10 196例对照的前瞻性研究中全面分析了基于综述、Meta分析和GWAS选择的12个乳腺癌易感基因位点与10个乳腺癌环境因素的交互作用,但并无显著性的发现,提示肿瘤的基因-环境交互作用研究需要极大的样本量 [21]

四、肿瘤诊断、治疗及预后生物标志物研究

分子生物标志物具有用于早期诊断、个体化治疗以及预后评价的潜能,是个体化医学的一个重要部分。如检测p53抑癌基因、K-ras癌基因的突变以及染色体畸变等可提高早期肺癌的阳性诊断率。此外,一些生物标记的改变还有肿瘤预后价值,如CerbB-2基因的扩增和过度表达提示乳腺癌不良预后,EGFR基因的突变可影响肺癌患者对化疗药物的敏感性等。这些研究进展为肿瘤治疗和预后评估及转化医学应用提供了具有重要应用价值的生物标志物。
尽管生物标志物与肿瘤临床诊疗相关的研究越来越受关注,但面对的挑战也不容乐观。例如,在很多研究中,由于生物取材的条件不统一、样本量小、检测质控条件差异、实验条件不一致、种族遗传学差异等因素导致一些研究结果不一致,甚至出现完全相反的结论。有研究者提出,目前发表的相当比例的肿瘤分子标志物尚未得到良好的临床研究证实,因此生物标志物的研究应具有“3M”策略,即强调多重(multiplex)分析、多标志物(multi-biomarker)分析以及多中心验证(multi-validation)。