推广 热搜: 免费网赚论坛  中国网赚  在家上网赚钱  如何网赚  网赚qq群  福缘网赚  外国网赚  网赚博客  酷我网赚  网赚任务平台 

欧洲血统女性乳腺癌风险的全基因组基因-环境相互作用研究

   日期:2024-04-20 12:58:43     来源:http://www.900614.com/    作者:小编    浏览:112    

摘要

背景

基因-环境相互作用的全基因组研究(G×E)可以识别与生活方式/环境暴露相关的疾病风险变异。我们进行了一项全基因组G×E分析,分析了约760万个常见变异和乳腺癌总体风险和雌激素受体阳性(ER +)乳腺癌的七种生活方式/环境风险因素。

方法

对来自乳腺癌协会联盟的72,285例乳腺癌病例和80,354例欧洲血统的对照进行了分析。使用标准的无条件逻辑回归模型和乳腺癌总体风险和ER +乳腺癌的似然比检验评估基因-环境相互作用。采用贝叶斯错误发现概率评估各snp风险因素对的可注意性。

结果

假设每个snp -危险因素对的真实关联的先验概率为1 × 10-5,贝叶斯错误发现概率< 15%,我们确定了两个独立的snp -危险因素对:rs80018847(9p13)-LINGO2和成人身高与总体乳腺癌风险相关(ORint = 0.94, 95% CI 0.92-0.96), rs4770552(13q12)-SPATA13和初月经年龄与ER +乳腺癌风险相关(ORint = 0.91, 95% CI 0.88-0.94)。

结论

总体而言,G×E相互作用对乳腺癌遗传性的贡献非常小。在人群水平上,乘法G×E相互作用对乳腺癌的风险预测没有重要贡献。

背景

乳腺癌是一种复杂的疾病,涉及生活方式/环境和遗传风险因素之间的相互作用。危险因素如胎次、母乳喂养、初潮年龄、首次足月妊娠年龄、体重指数(BMI)、身高、乳房x线摄影密度、外源性激素的使用和酒精摄入量等已得到确认[1,2,3,4,5,6,7]。通过协作性肿瘤基因环境研究(COGS)和oncoArray项目[8]等持续的合作努力,已经确定了200多个与乳腺癌风险相关的常见单核苷酸多态性(snp)[9,10,11]。

传统的全基因组关联研究(GWAS)分析评估变异的边际效应,可能会错过仅在人群的特定阶层中显示影响的变异。这些潜在的基因-环境相互作用中,snp与疾病风险以及生活方式/环境风险因素相关,可以通过全基因组基因-环境相互作用研究(GEWIS)进行调查[12,13,14,15]。

迄今为止,很少有关于乳腺癌中基因-环境(G×E)相互作用的全基因组研究,其中有三项研究将绝经期激素治疗作为单一环境风险因素[16,17,18]。对G×E相互作用的探索性分析检查了10个环境风险因素和从先前证据中选择的71,527个snp,使用了来自乳腺癌协会联盟(BCAC)约35,000例病例和对照的数据。该研究确定了两种可能与乳腺癌风险相关的G×E相互作用[19]。在本研究中,我们对参与BCAC的72,285例病例和80,354例对照进行了全面的全基因组分析,分析了基因-环境相互作用对整体乳腺癌风险的影响,以及雌激素受体阳性(ER +)乳腺癌的影响。

方法

研究样本

使用参与BCAC的46项研究(16项前瞻性队列,14项基于人群的病例对照研究和16项非基于人群的研究)的数据进行分析。我们排除了基因典型的男性,非欧洲血统,或患有未知侵袭性乳房肿瘤或原位乳腺癌的参与者。在招募时患有乳腺癌流行的妇女或参考年龄未知的妇女(定义为病例的诊断年龄和对照组的访谈年龄)也被排除在分析之外。此外,少于150例病例和150例对照风险因素的研究被排除在这些分析之外。每个参与研究都获得了参与者的知情同意,并得到了当地伦理委员会的批准。

风险因素数据

使用基于通用数据字典的多步骤协调过程检查来自个别研究的风险因素数据的质量。时间相关的风险因素变量与参考日期相关,参考日期定义为病例的诊断日期和对照组的访谈日期。对所有妇女进行以下危险因素分析:初潮年龄(每2年)、胎次(每1胎)、成人身高(每5厘米)、是否使用过口服避孕药(是/否)和目前是否吸烟(是/否)。首次足月妊娠年龄(每5年)分析仅在已分娩妇女中进行,体重指数(BMI,每5 kg/m2)分析仅在绝经后妇女中进行。如果参考年龄大于54岁,绝经状态要么是自我报告,要么被指定为绝经后。

基因数据

使用iCOGS[20,21]或oncoArray[9,10,22]对所有样本进行基因分型。简而言之,iCOGS是一种定制的iSelect SNP基因分型阵列,由~ 211,000个SNP组成[20,21],而oncoArray包括~ 533,000个SNP,其中近260,000个被选中作为GWAS主干(Illumina HumanCore)[22]。详细信息在其他地方提供[9,10,20,21,22]。数据输入到1000基因组参考小组(第3阶段第5版)。总体而言,通过iCOGS阵列进行基因分型的欧洲血统28,176例病例和32,209例对照,以及使用oncoArray阵列进行基因分型的44109例病例和48,145例对照被纳入该分析。

iCOGS中代入质量评分< 0.5或OncoArray中< 0.8,或小等位基因频率< 0.01的遗传变异被排除在分析之外。已知乳腺癌区域的变异也被排除在分析之外,因为已知易感变异和危险因素之间的相互作用已经在之前进行了探讨[23,24]。在应用所有排除后,分析中包括了7,672,870个遗传变异(snp和indel)。

统计分析

采用无条件logistic回归来评估snp和危险因素与乳腺癌风险的关系。在对数加性模型下,使用替代等位基因的预期拷贝数(“剂量”)作为协变量来评估基因型。通过使用似然比检验比较有或没有相互作用项的逻辑回归模型的拟合来检验遗传变异和危险因素之间的相互作用。所有模型都根据参考年龄、研究和10个祖先信息主成分进行了调整。为了解释研究设计中风险因素的潜在差异主要影响,所有模型都包括了风险因素和研究设计指标变量之间的相互作用项(基于人群vs.非基于人群)。目前吸烟的分析进一步调整了以前吸烟的情况。

分别对整体和ER +乳腺癌风险进行分析,并分别通过基因分型阵列进行分析。使用metaL对阵列特异性结果进行组合[25]。对分位数-分位数(Q-Q)图进行评估,以检验p值分布与零分布的一致性。相互作用P值小于5E-07被认为是相互作用的暗示证据。我们还计算了所有暗示性相互作用的贝叶斯错误发现概率(BFDP),假设每个snp风险因子对的真实关联的先验概率为1 × 10-5。总体而言,G×E与BFDP < 15%的相互作用被认为是值得注意的[26]。对于值得注意的snp风险对,我们还评估了G×E对er阴性乳腺癌风险的相互作用。对于值得注意的相互作用,我们按风险因素类别进行了分层分析。所有分析均使用R版本3.5.1进行。

我们使用LD评分回归估计了各危险因素G×E关联对乳腺癌家族相对危险度的全基因组贡献[27]。分析使用G×E相互作用汇总统计,仅限于来自1000基因组计划的欧洲人群中MAF > 5%的HapMap3 snp。在对数加性模型下,脆弱性量表上的G×E遗传率可由hf2 = hobs2 × var(X)/P(1-P)来估计,其中hobs2为LD评分回归给出的观测遗传率,var(X)为待评价风险因素的方差,P为样本中病例的比例。由G×E相互作用导致的乳腺癌家族相对危险度(FRR)的比例由hf2/2log(λ)给出,其中λ为病例一级亲属的家族相对危险度(假设为2)[28]。

目录

摘要 背景 方法 结果 讨论 结论 数据和材料的可用性 缩写 参考文献 Acknowlegements 作者信息 道德声明 补充信息 搜索 导航 #####

结果

分析中包括的研究摘要载于附加文件1:表S1。每次分析的病例和对照数从61,617例和74,698例均等对照到48,276例和60,587例吸烟对照不等(附加文件1:表S2)。与文献一致,首次足月妊娠年龄增加、成人身高增高、曾经使用过口服避孕药和目前吸烟与乳腺癌总体风险增加相关,而初潮年龄增加、生育、足月妊娠次数增加和母乳喂养与乳腺癌风险降低相关(附加文件1:表S3)。

与7个环境风险因素相互作用的全基因组分析得出了两个snp风险因子对,其中一个用于整体乳腺癌风险,另一个用于ER +乳腺癌风险(表1,图1,2,附加文件1:图S1A-S1B)。在测试统计中没有观察到任何环境风险因素的膨胀。通过G×E相互作用解释的乳腺癌风险脆弱性尺度上的遗传力见附加文件1:图S2。通过G×E相互作用解释的脆弱量表遗传性的估计比例在所有因素中都非常低,在首次足月妊娠的年龄(总体和ER +乳腺癌风险均约为1.5%)、初潮年龄和绝经后BMI中最高。

表1遗传变异提示(Pint≤5E−07)GxE相互作用对整体和雌激素受体阳性(ER +)乳腺癌风险的影响
图1
figure 1

成人身高与总体乳腺癌风险的全基因组相互作用的曼哈顿图。全基因组显著性阈值P < 5 × 10−8用黑色虚线表示。全基因组重大发现用蓝色突出显示

图2
figure 2

初潮年龄与雌激素受体阳性乳腺癌风险的全基因组相互作用的曼哈顿图。全基因组显著性阈值P < 5 × 10−8用黑色虚线表示。全基因组重大发现用蓝色突出显示。

对于总体乳腺癌风险,有证据表明SNP rs80018847与成人身高之间存在交互作用(ORint = 0.94, 95% CI 0.92-0.96, Pint = 4.34E - 08, BFDP = 11%),而rs80018847变异没有明显的边际效应(ORmarg = 1.00, 95% CI 0.98-1.03, Pmarg = 0.88)。根据先验定义的成人身高类别,rs80018847-G的每个等位基因ORmeta估计从低于158厘米的女性的1.03 (95% CI 0.94-1.13, Pmeta = 0.53),身高158 - 162厘米的女性的1.13(1.02-1.25)到168厘米或更高风险的女性的1.01 (95% CI 0.93-1.09, Pmeta = 0.88)不等(附加文件1:表S4)。因此,SNP与成人身高类别之间不存在线性关系。在ER阳性乳腺癌中也观察到与身高的相互作用(ORint = 0.95, 95% CI 0.93-0.97, Pint = 5.62 -06),但在ER阴性(ER-)乳腺癌风险中没有相互作用(ORint = 0.98, 95% CI 0.93-1.03, Pint = 0.77)。总体乳腺癌的区域图显示,在高连锁不平衡(LD)位点上,与rs80018847位点存在另一个SNP (rs1360506) (r2 = 0.81)(附加文件1:图S3)。

对于ER +乳腺癌的风险,SNP rs4770552与月经初潮年龄之间存在显著的交互作用(ORint = 0.91, 95% CI 0.88-0.94, Pint = 4.62 2e - 08, BFDP = 11%)。有微弱证据表明rs4770552-T等位基因与ER +乳腺癌之间存在边际关联(ORmarg = 1.02, 95% CI 1.00-1.05, Pmarg = 0.10)。每个等位基因ORmeta随着初潮年龄的增加而下降,从初潮年龄小于13年的1.07 (95% CI 1.00-1.15, Pmeta = 0.04)到初潮年龄大于15年的0.92 (95% CI 0.77-1.09, Pmeta = 0.33)(附加文件1:表S4)。有较弱的证据表明SNP rs4770552与初月经年龄之间存在相互作用(ORint = 0.93, 95% CI 0.90-0.96, Pint = 5.47E−06),但与ER-乳腺癌风险之间没有相互作用(ORint = 0.98, 95% CI 0.89-1.08), Pint = 0.66)。在这个位点上,我们发现了另外13个snp与雌激素受体阳性乳腺癌风险初潮年龄之间相互作用的证据。然而,这13个SNP与SNP rs4770552处于高LD (r2 = 0.8-1.0)(附加文件1:图S4)。

讨论

这是迄今为止最大的针对乳腺癌的全基因组基因-环境相互作用研究。我们发现了一个新的易感位点与成人身高的相互作用与总体乳腺癌风险增加有关,一个相互作用与月经初潮年龄增加ER +乳腺癌风险增加有关。然而,值得注意的是,尽管这些关联达到了全基因组统计显著性的常规水平,但它们可能仍然代表着偶然关联。基于假设的效应量先验分布,两个基因座的BFDP均为11%,值得注意。然而,需要更大样本量的研究来证实或反驳这些关联。

许多观察性研究表明,在绝经前和绝经后妇女中,成人身高增加与乳腺癌风险增加之间存在关联[7,29,30]。一项荟萃分析估计,身高每增加10厘米,乳腺癌风险增加17%[31]。身高和乳腺癌之间的生物学联系尚不清楚,但一些研究表明,身高增加对应于更多的干细胞获得驱动突变的风险[32]。另一种假设是,成人身高可能是营养摄入的替代指标,可能暗示胰岛素样生长因子1 (IGF1)的作用[33]。成人身高与SNP rs80018847之间潜在相互作用的功能基础尚不清楚。该SNP位于9号染色体短臂上富含亮氨酸重复和含有2基因(LINGO2)的Ig结构域的内含子区域(9p13)。该基因编码一个跨膜蛋白,属于LINGO/LERN蛋白家族[34]。小鼠胚胎研究显示中枢神经系统特异性表达LINGO2[34],但迄今尚未发现其与乳腺癌有关。

已知初潮年龄早与乳腺癌风险增加有关。月经开始时间每推迟一年,风险降低约5%[35]。据推测,初潮年龄越小,累积激素暴露时间越长,因此雌二醇水平升高[3,36]。SNP rs4770552是精子发生相关基因(SPATA13) 13q12的内含子变异。SPATA13编码RhoA、Rac1和CDC42 gtpase的鸟嘌呤核苷酸交换因子(GEF)[37,38]。虽然该基因在乳腺癌中的作用尚不清楚,但通过RhoA GTPases在乳腺肿瘤发生中的作用可能存在间接联系。Rho GTPase信号在人类乳腺癌中发生改变,Rho GTPase的失调可能对乳腺肿瘤的发展有不同的影响,这取决于分期和亚型[39]。RhoA的激活导致巨核母细胞白血病1 (MKL1)的释放,这反过来又被观察到改变ERα的转录活性,ERα已知在乳腺肿瘤中起关键作用[40]。因此,SNP rs4770552可能间接与SPATA13调控区相互作用,通过激活RHoA gtpase影响乳腺肿瘤发生过程。

鉴于常见遗传变异的边际效应很小,环境风险因素与乳腺癌的关联也不大,预计相互作用也很弱(附加文件1:图S5)。虽然这是迄今为止最大的乳腺癌数据集,有超过6万例病例和7万例对照,但这项研究在检测弱相互作用方面能力不足。此外,这项研究只包括欧洲血统的女性,研究结果可能不适用于其他血统的女性。

使用LDSC回归,我们估计了由于G×E每个风险因素的总体遗传力。估计的脆弱量表遗传力(≤0.015)可与SNP主效应的相应遗传力(其遗传力约为0.47)或基于家族风险的总体遗传力(~ 1.4)进行比较[28,41]。这意味着G×E相互作用对乳腺癌的遗传性贡献很小,至少对于可以使用全基因组阵列评估的已知风险因素和常见遗传变异来说,因此对人口水平的风险预测没有重要贡献。这与极少检测到G×E相互作用的事实是一致的。这并不排除G×E相互作用可以在其他大型研究中确定的可能性,或者这种相互作用可能为机制提供重要线索。

结论

总之,我们确定了两种新的全基因组基因-环境相互作用,用于欧洲血统女性的整体和ER +乳腺癌风险。这些结果通过产生合理的生物学假设,为我们对乳腺癌遗传易感性的全球知识体系做出了贡献,但它们需要复制和进一步的功能研究。

补充信息

AdditioNal文件1

。欧洲血统女性乳腺癌风险的全基因组基因-环境相互作用研究。补充表1:参与研究的病例总数和每项研究的对照。补充表2:按研究设计和病例对照状态划分的研究人群特征的详细信息。补充表3:在基于人群和队列的研究中,流行病学危险因素与总体和er特异性亚型乳腺癌风险的关联。补充表4:按危险因素分类的全基因组显著相互作用结果分层分析结果。补充图1:A)成人身高对总体乳腺癌风险的分位数-分位数(Q-Q)图和B)初潮年龄对ER+乳腺癌风险的全基因组相互作用图。补充图2:GxE对总体和雌激素受体阳性乳腺癌风险的相互作用解释了脆弱尺度的遗传力。补充图3:SNP rs80018847与成人身高总体乳腺癌风险相互作用分析的区域关联图。补充图4:SNP rs4770552与月经初潮年龄对ER+乳腺癌风险相互作用分析的区域关联图。补充图5:对于不同样本量(N = 4万~ 12万,增量1万)的1:1不匹配病例对照研究,在不同次要等位基因频率(0.01 ~ 0.5:见下图)下检测基因-环境相互作用优势比(y轴)的功率(x轴)。功率计算采用Quanto 1.2.4,假设对数加性模型,SNP边际效应估计值为1.10,环境风险因子边际效应估计值为1.20,双侧alpha为5 × 10-08。我们还假设环境风险因素的患病率为15%,疾病患病率为1%。

下载原文档:https://link.springer.com/content/pdf/10.1186/s13058-023-01691-8.pdf

文章链接:http://900614.com/news/show-86462.html
 
 
更多>同类资讯

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  RSS订阅  |  违规举报