摘要
研究目的:在全球范围内,肺癌成为各类肿瘤中病发率以及死亡率首位的恶性肿瘤,其中85%的患者可以划分为非小细胞肺癌(NSCLC)这一亚型。在过去的十几年来,种类繁多的靶向药相继上市,但是为何在针对同一靶点用药时,病人的获益情况却大有不同?这个问题一直是肿瘤研究的焦点。近来,研究者发现在肿瘤中普遍存在可变剪切的现象,可变剪切(Alternative splicing)是基因转录所产生的前体mRNA通过去除内含子区域,选择性地保留或排除特定外显子,从而生成编码不同蛋白质的各种转录本。通过这种方式,同一基因能够编码并翻译成多种不同或是具有微小差异的蛋白,从而表达不同的功能。这一观点为解释肿瘤的异质性开辟了新的思路。目前,可变剪切在非小细胞肺癌中的研究较少,因此,为了探索其对非小细胞肺癌患者预后的影响以及作用机制,我们开展了本次研究。
研究方法:首先,收集The Cancer Genome Atlas数据库中522例腺癌(LUAD)以及573例鳞癌(LUSC)病例的测序数据,基因表达数据和临床数据。其次,收集青岛大学附属医院胸外科术后病理诊断明确的40例腺癌和20例鳞癌患者的新鲜组织。
通过设置严格的标准筛选TCGA的病例,并按照性别将LUAD与LUSC内部再次分成两个亚组,通过TCGA SpliceSeq软件处理测序数据从而得到病人每种可变剪切事件(AS)的PSI数据,随后与临床数据以及表达数据相匹配。选取每组中的配对样本计算肿瘤组织和正常组织中显著差异表达的AS事件,随后通过统计学方法计算哪些事件为独立预后因素并建立多因素风险比例回归模型。上游调控因子探索:选取每组中的配对样本计算肿瘤组织和正常组织中显著差异表达的可变剪切因子(Splicing factor),随后将差异SF与预后AS做相关性分析;下游功能机制探索:用预后相关的剪切事件所对应的亲本基因进行功能富集分析临床应用:对每组的临床数据进行单因素Cox回归分析,将p.value < 0.05的临床指标与多因素风险比例回归模型一同建立可视化Nomogram模型。实验验证:提取收集的新鲜组织样本的总RNA,并反转为cDNA。设计特异性的两段引物,通过qPCR来获取每个组织的PSI数据,随后进行配对样本的差异分析,验证剪切事件的发生。
结果:通过分析,LUAD中男性与女性亚组中各确定8种剪切事件为独立预后因素;LUSC中男性与女性亚组中各确定7种剪切事件为独立预后因素,所建立的多因素风险比例回归模型的ROC值也均在0.75以上。我们建立了一个SF与AS调控的相关性网络,也根据风险因素预测了其下游可能存在的调控机制。此外,所建立的Nomograms模型的C指数均在0.7以上,矫正曲线也显示模型稳定。最终,挑选的四种剪切事件也的确在肿瘤和正常组织中存在显著的表达差异。
结论及意义:我们以可变剪切为出发点,通过系统的分析发现在非小细胞肺癌中不同性别的患者其剪切特征却有不同。据此我们探索了包括上游调控因子以及下游信号通路在内的完整作用机制,并在组织样本中进行了初步验证。此外,为了拓展可变剪切在临床上的应用,我们将可变剪切的风险比例回归模型与临床指标结合起来,可以用于预测病人早期复发和肿瘤预后。综上所述,我们的研究对探索转录本的多样性对非小细胞肺癌的产生和发展的影响具有重要意义,我们所发现的各个独立预后因素均可作为后续研究的方向,临床模型也将指导临床医生判断患者肿瘤的预后和复发情况。
关键词:可变剪切;非小细胞肺癌;预后;
引 言
在全世界范围内,肺癌位于所有恶性肿瘤病发率和死亡率的首位,据估计,2018年份约有210万患者新发肺癌以及180万患者最终死亡[1]。而在我国,肺癌发病率也日渐上升,特别是女性患者比例正在不断提高,男女肺癌发病比率逐渐缩小。在所有肺肿瘤中,非小细胞肺癌(NSCLC)类型大约占85%,而肺腺癌(LUAD)和肺鳞状细胞癌(LUSC)是其中最普遍的亚型[2]。不同肿瘤类型以及不同性别在非小细胞肺癌发生发展中是否扮演重要角色?目前,与之相关的系统性分析较少,因而具有十分重要的研究价值。
在过去的十几年来,精准治疗领域飞速发展,发病机制以及新型靶点的研究取得重要突破,靶向药物也层出不穷,但是为何不同患者在针对同一突变靶点治疗时,获益大不相同?此前的研究大多关注于基因层面的变化,如基因突变,拷贝数变化,甲基化等,很少提及基因转录后修饰的影响[3][4]。近来,可变剪切(Alternative splicing)导致转录本多样性这一观点的提出引起了众多研究者的关注。
人类基因组中只有20,000个基因,而细胞的功能和分化需要远不止于此的蛋白质,而可变剪切便是产生这些蛋白质的一种重要机制[5-7]。可变剪切通过去除内含子区域,选择性地保留或排除多外显子基因中的特定外显子来生成微小差异或完全不同的蛋白质[8]。这一观点解释了为什么许多研究中,明明是同一个基因,其致癌能力不同,甚至完全相反,因为同一基因转录本占比不同,其综合体现出的功能也就不同。近几年来,研究者发现可变剪接在肿瘤产生与发展中起着关键作用(包括无限复制,组织侵袭和转移,持续性血管生成和避免免疫破坏)[9-13],因而可变剪切可能在肿瘤治疗中具有巨大的潜力,也成为研究热点之一[14-16]。
随着新一代测序技术的发展,检测所需费用不断降低,大规模的临床转录组测序项目得以开展,诸多以往无法得到的数据逐渐积累。近来,多个大型数据库建立并公开,种类繁多的珍贵数据为所有科研者搭建了一个高水平的平台,充分利用这些数据,通过综合系统的分析可以充分挖掘肿瘤的进展机制及分子基础,从而得出非常有价值的,能够指导实验研究以及临床治疗的重要信息[17]。
迄今为止,关于可变剪切在肺癌中的系统性分析较少,也并未有研究探索不同肿瘤类型以及不同性别的患者间是否在可变剪切方面存在着差异。因此,我们从The Cancer Genome Atlas (TCGA)数据库中下载了相关数据,期望经过一系列的分析,能够筛选出在非小细胞肺癌预后发挥作用的相关可变剪切事件,对比出不同类型肿瘤及不同性别间可变剪切事件有何区别,探索出完整的可变剪切在非小细胞肺癌中可能的上下游调控机制,为探索非小细胞肺癌患者可能的生物靶点提供重要的理论依据。
此外,现今肿瘤的筛查与确诊还主要依靠影像学手段,如何找到无创且有效的生物标志物辅助临床治疗是当下研究的重中之重,目前主流的方法大多是联合多个风险因素共同构建一个模型来预测患者预后或者复发。列线图(Nomogram)因其便于操作,可视化等优点成为目前研究者普遍认可得新型预后模型。当下还没有使用可变剪切构建非小细胞
肺癌预后模型的研究[18],因此,我们选择各组中独立预后因素分别建立了多因素Cox风险比例回归模型,并将该模型与更多临床指标联合起来,共同构建可视化的Nomogram模型,通过矫正检验,该临床模型稳定且有效,可以在临床实践中进一步验证。
材料和方法
1数据收集
首先,从TCGA数据库(https://tcga-data.nci.nih.gov/)检索LUAD和LUSC两组队列的相关数据,包括Sequencing reads、Transcriptome profiling和Clinical data。随后,应用软件SpliceSeq 2.1处理高通量mRNA测序的数据,来得到mRNA不同剪接模式,此软件识别的剪切模式为3’端可变剪接(AA)、5’端可变剪接(AD)、启动子改变(AP)、终止子改变(AT)、外显子跳跃(ES)、内含子保留(RI)和外显子互斥(ME),并用剪接百分比(PSI)用以表示不同剪切事件的出现概率[19]。
随后,将PSI数据,转录本表达数据和病人临床数据相互匹配,得到此次研究所需的完整数据集。此外,为了得到严谨可信的数据,我们设置了严格的筛选标准:(1)每种剪切事件至少在75%的样本中出现;(2)患者具有明确的非小细胞肺癌组织学诊断;(3)具有完整的临床指标的数据:包括年龄,病理分期,TNM分期;(4)患者初步病理诊断后的总生存期(OS)超过30天;
此外,为了能够对剪切事件进行横向比较,每种剪切事件都被辅以一个独一无二的标签,由剪切类型,基因名称和编号构成,格式为“ES_PLEKHN1_ID_000001”。
2统计学分析
本次研究若无特殊说明,均使用R语言作为分析软件,t-test和方差分析用于比较连续变量,Spearman秩相关分析用于非正态分布数据,Pearson相关分析用于满足正态分布的连续变量,使用Kaplan-Meier方法进行生存分析,adjust.p <0.05被认为具有显著统计学意义。
2.1可变剪切事件差异表达分析
首先,将LUAD和LUSC队列内部按性别再次分为两个亚组,提取出每个亚组中的配对样本使用包(版本3.42.1)进行差异性分析[20],得到差异剪切事件(DEAS),在这里我们并没有将表达差异两倍以上作为筛选条件,因为PSI本身作为一个比值类型变量,设定该条件可能会遗漏很多有意义的剪切事件。之后,针对具有显著意义的结果,我们使用Venn图来展示四组间剪切方式的异同,使用Upset图展示每组剪切方式的分布特征[21]。
2.2预后相关剪切事件分析及下游机制探索
为使统计分析稳定可靠,我们将每个亚组中所有剪切事件按PSI值的中位数分为高表达与低表达后,使用Survival包(3.1-8版)进行单因素Cox回归以探讨何种剪切事件为影响预后的风险因素。随后,我们还期望能够找到这些差异剪切事件是通过何种方式在肿瘤产生与进展中发挥作用,为后续的功能通路研究作出方向上的指导,因此我们进行了功能与通路富集分析。Metascape(http://metascape.org/)是一个在线通路富集分析网站,它整合了40多个独立数据库,为研究者简化了操作并作出详细的解释。我们选择与预后相关的DEAS事件的相应亲本基因作为候选基因,通过该网站进行了通路的富集。
2.3临床预后模型的建立
我们先通过lasso回归分析筛选单因素Cox有意义的事件以确保模型稳定[22],后将筛选到的变量通过逐步向前方法做多因素Cox回归分析从而建立模型。使用Kaplan-Meier分析检验模型生存情况,做ROC曲线观察模型预测的稳定性。随后将模型联合单因素Cox有意义的临床指标,共同建立Nomogram模型。这些分析分别使用了R语言中survminer包(0.4.3版),survivorROC包(1.0.3版)和timeROC包(0.3版)。
2.4建立剪切因子与剪切事件相关性网络
我们首先从SpliceAid2数据库中检索到人类剪接因子(Splicing factors)共67个[23]。随后从TCGA数据库下载了这些剪接因子的转录本表达数据,并通过DESeq2软件包(1.22.2版)进行了标准化)[24]。 同样,分别对四个亚组的剪切因子进行差异分析。 随后,使用Hmisc(版本4.30)计算差异剪切因子的mRNA表达值与预后相关的差异剪切事件的PSI值之间的相关性。最后,通过Cytoscape(版本3.7.1)生成了剪切因子与剪切事件相关性网络。
3实验试剂及设备
实验仪器和试剂 | 生产公司 |
RNAwait(非冻型组织RNA保存液) | 北京索莱宝 |
UNlQ-10柱式Trizol总RNA抽提试剂盒 | 生工生物 |
柱式microRNA抽提试剂盒 | 生工生物 |
琼脂糖B | BBI |
4S Red Plus 核酸染色剂(10,000 X 水溶液) | BBI |
GeneRuler DNA Ladder Mix | Thermo Scientific |
Maxima Reverse Transcriptase | Thermo Scientific |
SYBR Premix EX TaqTM | TaKaRa, Otsu, Japan |
洁净工作台 | 江苏苏洁净化设备厂 |
高速冷冻离心机 | 安徽中科中佳仪器有限公司 |
电泳仪 | 北京六一 |
电泳槽 | 上海精益有机玻璃制品仪器厂 |
凝胶成像系统 | 上海复日科技有限公司 |
微量分光光度计 | Merinton Instrument, Inc |
移液器(范围100-1000ul,20-200ul,0.5-10ul) | 加拿大 BBI公司 |
Applied Biosystems Veriti | Thermo Fisher Scientific |
FTC-3000p Real- Time PCR system | Funglyn Biotech, Shanghai, China |
4标本收集与处理
为验证生物信息学分析的准确性,我们收集青岛大学附属医院崂山院区胸外科手术切除的配对新鲜组织,并立即转至RNA保存液中放于负80摄氏度保存,经组织病理学诊断为非小细胞肺癌的入选队列之中,最终将样本按照组织学亚型及患者性别分成四组:腺癌男性,腺癌女性,鳞癌男性和鳞癌女性。
4.1RNA提取(UNLQ-10柱式TRIZOL总RNA抽提试剂盒)
1) 样品准备,取肿瘤组织,每10-20 mg 组织加入0.5ml Trizol,使用匀浆器充分研磨,室温下放置5-10 min,目的是使核蛋白和核酸全部分开。此外,如果样品中包含较多的脂肪、多糖、蛋白质或细胞外基质,可通过室温下转速12,000 rpm 快速离心10 分钟,移去上层油脂后,取上清。
2) 在上述样品中,加入0.2ml 氯仿,剧烈震荡30秒,室温下放置3分钟, 4°C下12,000rpm离心10分钟。(注:如不能机器旋涡震荡,可用手上下颠倒混匀 2 分钟。样品会分成三层:上层水相,中间层和下层有机相。RNA 在上层水相中。)
3) 吸取上层水相,宁少勿多,枪头不要碰触中间层,否则会出现染色体 DNA 污染,转移至干净的EP管中,随后加入1/2倍体积无水乙醇并混匀,此时可能会产生半透明纤维状悬浮物,不影响提取和应用。
4) 组装吸附柱与收集管,将步骤3中得到的液体全部悬空滴加至吸附柱正中,室温下静置2分钟,随后室温下转速12,000 rpm 离心3分钟。
5) 倒掉收集管中废液,将吸附柱放回收集管中,随后加入500 µl RPE Solution,室温静置2分钟,随后转速10,000 rpm 离心30秒。
6) 重复步骤5一次。
7) 倒掉收集管中废液,将吸附柱重新放回收集管中,室温下转速10,000rpm 离心2分钟。
8) 将吸附柱放于干净的1.5 ml EP管中,在吸附膜正中悬空滴入30 µl DEPC处理的双蒸水,室温静置5 min,随后转速12,000 rpm 离心2分钟,将最终得到的RNA溶液测量OD值,260/280在1.8-2.0之间的样品于-70°C留存用于后续实验。
4.2反转录(cDNA第一链合成,RNA按照 800 ng反转)
1)在冰盒上放置无核酸酶的 PCR管,并加入以下试剂:
组分 | 体积(μl) |
total RNA | X |
Random Primer(100 pmol)(microRNA用特异性引物) | 1 |
dNTP Mix(0.5 mM final concentration) | 1 |
Rnase-free ddH2O | 定容至14.5 |
2) 充分混匀后离心3-5秒,在65°C温浴5分钟后,冰浴2秒,然后立即离心3-5秒;
3) 将试管放回冰盒,再加入下列试剂:
组分 | 体积(μl) |
5X RT Buffer | 4 |
Thermo Scientific RiboLock RNase Inhibitor (20 U) | 0.5 |
Maxima Reverse Transcriptase (200 U) | 1 |
4) 充分混匀后离心3-5秒;
5) 在PCR仪器上按照下列条件进行反转录反应:
温度(°C) | 时间(min) |
25 | 10 |
50 | 30 |
85 | 5 |
6) 将上述溶液-20°C留存用于后续实验。
5实时荧光定量PCR
首先在冰上配制 PCR 反应液,考虑在吸取时存在误差,制备预混液的体积要多于所用总体积的10%。
试剂 | 使用量 | 终浓度 |
TB Green Premix Ex Taq II(Tli RNaseH Plus)(2X) | 10 μl | 1X |
PCR Forward Primer(10 μM) | 0.8 μl | 0.4 μM |
PCR Reverse Primer(10 μM) | 0.8 μl | 0.4 μM |
DNA 模板(<100 ng) | 2 μl | |
灭菌水 | 6.4 μl | |
Total | 20 μl |
反应程序为,预变性(95°C 30秒),随后PCR反应(95°C 5秒,60°C 30秒)共40个循环。仪器为FTC-3000p PCR system,通过2-ΔΔCT方法计算基因表达。为计算每种剪切事件的PSI值,我们需要针对每种剪切事件设计两对引物,其中一对引物位于基因发生剪切的序列上,另一对引物位于该基因所有转录本的CDS序列上。通过qPCR获得每个基因剪接区域及其CDS区的表达量,两者只比便是该基因的PSI值(注意,剪切类型为外显子跳跃(ES)时,PSI的值为一减该比值)。得到每个亚组中肿瘤与正常组织的PSI值
之后,使用limma包进行配对样本的差异分析,将分析的结果使用箱形图展示。
结果
1可变剪切在非小细胞肺癌组织中分布
最终, 经过筛选后共491位LUAD患者和473位LUSC患者被纳入本次研究的数据集中。图2A为各类型剪切事件的模式图,红色柱体为发生可变剪切的区域,绿色线条为剪切前的连接方式,红色线条为剪切后的连接方式。在LUAD组中,共检测到10366个基因发生43948个剪切事件,其中发生ES类型包含6618个基因的16793个剪切事件,AP类型包含3605个基因的8992个剪切事件,AT类型包含3734个基因的8546个剪切事件,AA类型包含2522个基因的3559个剪切事件,AD类型包含2173个基因的3057个剪切事件,RI类型包含1866个基因的2783个剪切事件和ME类型包含214个基因中的220个剪切事件; 在LUSC组中,共检测到10557个基因发生46020个剪切事件,其中发生ES类型包含6810个基因的18029个剪切事件,AP类型包含3737个基因的9301个剪切事件,AT类型包含3748个基因的8578个剪切事件,AA类型包含2636个基因的3752个剪切事件,AD类型包含2278个基因的3263个剪切事件,RI类型包含1908个基因的2862个剪切事件和ME类型包含227个基因中的235个剪切事件。剪切事件具体分布如图2B/C所示,其中ES类型是可变剪切的主要剪切方式,而ME是最不常见的剪切方式。
2可变剪切在非小细胞肺癌组织中差异表达
通过比较肿瘤与正常组织之间剪接事件的差异,我们发现了参与肿瘤发展和预后的关键事件。如图3A所示,LUAD与LUSC组各有9358与14153个剪切事件在肿瘤与正常组织中具有显著差异,其中6492个剪切事件相同,但是LUSC组中差异事件明显增加,说明其剪切事件发生更加频繁。当将数据集细分为四个亚组时,我们可以发现相比于总体来说,每组都有自己独特的剪切方式(图3 B/C),证明不同性别发生可变剪切的种类有所差异,在LUAD中女性组的剪切事件发生频率比男性组更高,而在LUSC正好相反。Upset图中显示了每个亚组中剪切事件的具体分布,其中LUSC的男性群体表现出更复杂的剪接方式,同一基因可以产生4到5种剪切事件,据此可以推测该基因可能通过多种转录本的共表达发挥复合作用,共同影响肿瘤发生(图3D/E/F/G)。
3非小细胞肺癌患者预后相关可变剪切与作用机制探索
通过单因素Cox回归分析,我们在LUAD中男性组发现286个预后相关的差异剪切事件,其中包括138个风险因素和148个保护因素;在LUAD中女性组发现582个预后相关的差异剪切事件,其中包括279个风险因素和303个保护因素;在LUSC中男性组发现912个预后相关的差异剪切事件,其中包括463个风险因素和449个保护因素;在LUSC中女性组发现113个预后相关的差异剪切事件,其中包括57个风险因素和56个保护因素。通过以上数据我们发现,每个亚组中风险因素与保护因素数量基本相当,它们通过一种复杂的网络共同影响肿瘤的发生与发展。
为了探索这些预后相关的差异可变剪切产生作用的分子机制,我们随后进行了比较全面的GO和KEGG功能通路的富集,如图4所示。通过对比我们发现四个队列中共同富集到的功能通路是“Hallmark epithelial-mesenchymal transition”, “cell adhesion molecule binding”和“regulation of cell cycle process”,这些通路均与细胞的趋化、粘附和增殖有关,说明可变剪切可能在肿瘤的增殖和转移过程中发挥重要作用。此外,每个亚组都各自富集了不同类型的经典的功能通路,这代表着了各亚组的剪切事件可能在不同的方面影响着肿瘤的发生与发展。例如,在LUAD男性组中,我们发现整合素A9B1相关通路显著富集,有研究表明A9B1是一种多功能受体,对细胞生存和增殖具有重要的调节作用;在LUAD女性组中,我们发现了发现了MYC抑制相关通路被显著富集,有研究表明该途径在细胞增殖,分化,凋亡中起着重要作用; 在LUSC男性组中我们检测到“ VEGFR1/2通路”和“ FAK通路”显著富集;在LUSC女性组中我们发现“ p53通路”被显著富集。具体情况可在图中得到更多的信息,在这里就不一一列举了,以上功能通路的富集为后续探索NSCLC中可变剪切影响肿瘤进展的分子机制机制提供了重要线索,我们已经计划开展专门的实验,来进一步证明这些通路的发生,比之若干年前只能通过猜测功能通路的发生具有重要进步。此外,不同功能同路的的发现也表明四个亚组的肿瘤发生起因和后续治疗可能有所不同,因此在后续治疗中我们可能需要针对不同亚族的特点进行个体化的评估与治疗。
图4 差异剪切事件功能富集分析
4可变剪切预后模型建立
为了探索可变剪切对肿瘤预后的影响,我们建立多因素Cox风险比例模型。首先,为了减小变量的过度拟合,我们使用lasso回归分析筛选变量,最终,LUAD男性组与女性组分别剩63个和17个差异剪切事件作为候选;LUSC男性组与女性组分别剩15个和19个差异剪切事件作为候选,筛选过程如图5所示。
图5 lasso回归分析
之后我们对候选变量进行多因素风险分析,最终构建了四个多因素Cox风险比例模型(表1-4)。随后便对模型进行进一步的检验,首先,按照风险模型的比例评分将每个亚组的患者为高风险组与低风险组,用Kaplan-Meier分析检验模型检测患者的生存状况。其次,绘制每个模型一、三、五年的ROC曲线并计算曲线下面积(AUCs),每个模型均表现出稳定的预测能力(图6)。
ID | Median | B | SE | 瓦尔德 | 自由度 | 显著性 | Exp(B) | 下限 | 上限 |
AP_PDE4D_ID_072135 | 0.2926 | 1.830 | 0.481 | 14.470 | 1 | 0.000 | 6.235 | 2.428 | 16.008 |
ES_FAM21A_ID_011561 | 0.9916 | 1.588 | 0.418 | 14.423 | 1 | 0.000 | 4.892 | 2.156 | 11.100 |
AT_HNRNPLL_ID_053259 | 0.1918 | 1.357 | 0.417 | 10.588 | 1 | 0.001 | 3.884 | 1.715 | 8.794 |
ES_LMO7_ID_026067 | 0.5534 | 1.133 | 0.410 | 7.632 | 1 | 0.006 | 3.105 | 1.390 | 6.936 |
AP_UBE2E1_ID_063714 | 0.65585 | 0.830 | 0.382 | 4.715 | 1 | 0.030 | 2.294 | 1.084 | 4.854 |
AP_SSFA2_ID_056438 | 0.2224 | -0.964 | 0.475 | 4.116 | 1 | 0.042 | 0.382 | 0.150 | 0.968 |
ES_CA5B_ID_098313 | 0.4595 | -0.998 | 0.407 | 6.004 | 1 | 0.014 | 0.369 | 0.166 | 0.819 |
AP_KIAA1217_ID_010995 | 0.07025 | -1.642 | 0.450 | 13.296 | 1 | 0.000 | 0.194 | 0.080 | 0.468 |
表1 LUAD男性组多因素Cox风险比例模型
表2 LUAD女性组多因素Cox风险比例模型
ID | Median | B | SE | 瓦尔德 | 自由度 | 显著性 | Exp(B) | 下限 | 上限 | |
AA_PGBD2_ID_010573 | 0.913 | 1.253 | 0.263 | 22.767 | 1 | 0.000 | 3.500 | 2.092 | 5.854 | |
AT_RPGRIP1L_ID_036421 | 0.2862 | 0.918 | 0.268 | 11.772 | 1 | 0.001 | 2.504 | 1.482 | 4.230 | |
AD_DAG1_ID_064888 | 0 | 0.914 | 0.263 | 12.047 | 1 | 0.001 | 2.494 | 1.489 | 4.179 | |
AA_ZDHHC8_ID_061144 | 0.98975 | 0.725 | 0.262 | 7.639 | 1 | 0.006 | 2.065 | 1.235 | 3.453 | |
ES_NDRG2_ID_026512 | 0.7794 | 0.710 | 0.259 | 7.546 | 1 | 0.006 | 2.035 | 1.226 | 3.377 | |
AT_NUPL2_ID_078961 | 0.93815 | 0.642 | 0.273 | 5.509 | 1 | 0.019 | 1.899 | 1.112 | 3.246 | |
ES_HPCAL1_ID_052659 | 0.3166 | 0.616 | 0.268 | 5.286 | 1 | 0.021 | 1.852 | 1.095 | 3.131 | |
AT_EIF4E2_ID_058000 | 0.72935 | 0.610 | 0.256 | 5.698 | 1 | 0.017 | 1.841 | 1.115 | 3.038 |
表3 LUSC男性组多因素Cox风险比例模型
ID | Median | B | SE | 瓦尔德 | 自由度 | 显著性 | Exp(B) | 下限 | 上限 |
AT_PSPC1_ID_025403 | 0.1893 | 0.683 | 0.242 | 7.944 | 1 | 0.005 | 1.980 | 1.231 | 3.183 |
RI_CCDC88A_ID_053613 | 0.9666 | 0.610 | 0.226 | 7.283 | 1 | 0.007 | 1.841 | 1.182 | 2.868 |
AT_LARP6_ID_031442 | 0.4931 | 0.599 | 0.249 | 5.771 | 1 | 0.016 | 1.820 | 1.117 | 2.968 |
AD_ARL6IP4_ID_025037 | 0.45015 | 0.527 | 0.246 | 4.605 | 1 | 0.032 | 1.694 | 1.047 | 2.741 |
AP_ABHD17A_ID_046553 | 0.4997 | -0.509 | 0.248 | 4.217 | 1 | 0.040 | 0.601 | 0.370 | 0.977 |
ES_COX5A_ID_031812 | 0.55645 | -0.520 | 0.234 | 4.947 | 1 | 0.026 | 0.594 | 0.376 | 0.940 |
AP_CEPT1_ID_004140 | 0.2257 | -0.590 | 0.222 | 7.067 | 1 | 0.008 | 0.554 | 0.359 | 0.856 |
表4 LUSC女性组多因素Cox风险比例模型
ID | Median | B | SE | 瓦尔德 | 自由度 | 显著性 | Exp(B) | 下限 | 上限 |
ES_FAM131A_ID_067936 | 0.5944 | 1.953 | 0.495 | 15.544 | 1 | 0.000 | 7.047 | 2.670 | 18.602 |
ES_KIFC3_ID_036608 | 0.9534 | 1.668 | 0.449 | 13.836 | 1 | 0.000 | 5.304 | 2.202 | 12.777 |
ES_KIF13A_ID_075458 | 0.74045 | -1.029 | 0.466 | 4.873 | 1 | 0.027 | 0.357 | 0.143 | 0.891 |
RI_RPL29_ID_065167 | 0.89155 | -1.161 | 0.474 | 5.997 | 1 | 0.014 | 0.313 | 0.124 | 0.793 |
AT_LAMP2_ID_089999 | 0.59745 | -1.396 | 0.457 | 9.308 | 1 | 0.002 | 0.248 | 0.101 | 0.607 |
AP_MAZ_ID_035938 | 0.3897 | -1.622 | 0.488 | 11.033 | 1 | 0.001 | 0.198 | 0.076 | 0.514 |
AP_ZBTB7B_ID_007876 | 0.4008 | -2.198 | 0.545 | 16.269 | 1 | 0.000 | 0.111 | 0.038 | 0.323 |
图6 KM-plot与ROC曲线
此外,图7的三张复合图片展示了每个模型在患者生存,风险评分和剪接模式分类中的能力。通过我们的评分系统,可将患者的生存与死亡显著分开
图7 模型生存分布
5可变剪切上游调控因子探索
目前,共71个剪切因子已被发现和证明[23],经过与TCGA数据库所下载转录本表达数据相匹配,共67个剪切因子被纳入此次研究。经过差异分析,LUAD男性组与女性组分别有25和 26个剪切因子具有显著差异,LUSC 男性组与女性组分别有36和30个剪切因子具有显著差异。差异剪切因子与差异剪切事件网络如图8,图中点的大小表示该事件在网络中的重要程度,连接线条为红色表示两者之间为正相关,连接线条为蓝色表示两者之间为负相关,差异剪切因子位于网络图外围,红色表示该因子上调,蓝色表示该因子下调;差异剪切事件位于网络图内圈,红色表示该事件为风险因素,蓝色表示该事件为保护因素。
图8 剪切因子与预后模型中剪切事件相关性网络图
6临床Nomogram模型的建立
此外,为了扩展可变剪切的应用,我们尝试建立Nomogram模型将剪切事件与临床治疗联系起来。 最终,Nomogram模型中包括的临床病理变量包括年龄,病理阶段,T,N,M阶段和最终的复合模型(图9A,B,C,D)。 值得一提的是,我们将AS模型的风险评分分为四个级别,以确保Nomogram的实用性。 此外,列线图的校准曲线在预测预后时有较强的稳定性(图9E,F,G,H)。在LUAD队列中, 男性组的预测C指数为0.777(95%CI:0.748-0.806),女性组的预测C指数为0.827(95%CI:0.796-0.858);在LUSC队列中, 男性组的预测C指数为0.729(95%CI:0.704-0.754) ,女性组的预测C指数为0.843(95%CI:0.813-0.873)。可见,我们所构造的Nomogram模型在临床实践中具有巨大的潜力。
图9 Nomograms模型
7可变剪切表达验证
经过病理组织学筛选,最终LUAD组中有20个男性和20个女性的配对样本被纳入研究,LUSC组中有10个男性和10个女性的配对样本被纳入研究。
我们查阅了模型中每个剪切事件的是否具有相关研究,最终在每个预后模型中各选定了一个剪切事件进行进一步验证。通过qPCR的结果计算剪切事件的PSI值,使用limma包计算配对样本的PSI差异表达,结果如图10所示。这四个剪切事件的发生占比在肿瘤组织中均显着上调,与之前生信分析结果一致,表明这些剪切事件的在肿瘤的发生发展中可能扮演重要角色,可以进行下一步的详尽的功能机制的研究。
图10 剪切事件的qPCR验证
讨论
在过去的十年中,学者们集中研究如何在基因层面找到有效的生物标志物,来改善非小细胞肺癌的诊断和预后[25, 26]。然而,非小细胞肺癌的产生与发展由一个复杂网络的调控,因此,相比于单一生物标志物来说,联合多个生物标志物建立模型才是预测肿瘤预后的有效方法。
目前,研究大多局限于基因突变和转录水平,导致部分现象难以解释,比如同一基因发生突变时,为何在不同种类的肿瘤中致癌作用不尽相同,甚至有可能相反。可变剪切的提出可以更好的阐明这些问题,即每一个基因转录出pre-mRNA后,经多种剪切因子调控下,产生不同的转录本,多个转录本的优势占比不同时,该基因会体现出不同的功能,从而在肿瘤的增殖,侵袭,转移,凋亡和耐药性等方面发挥不同的作用[9, 11, 27]。近来有研究证明,已经有超过12种剪切事件对非小细胞肺癌的发生和预后具有重要影响。例如,Boudria(2019)发现VEGFxxx和VEGFxxxb家族可以编码VEGF-A的多种剪切事件如VEGF165b / VEGF165,它们所翻译产生的蛋白质仅在C末端存在六个氨基酸的不同。实验证明,高VEGF165b / VEGF165比值可以导致肿瘤的淋巴结转移,VEGF165b可通过形成VEGFR /β1整合素环促进肿瘤细胞的增殖和侵袭。值得注意的是,贝伐单抗,作为用于治疗肺腺癌患者的常见VEGF抑制剂,可以增加VEGF165b的表达并激活侵入性VEGFR /β1整合素环,这肯能是影响贝伐单抗在非小细胞肺癌中疗效的重要因素[28]。MET是一种高亲和力的酪氨酸激酶(RTK),它的激活可以促进细胞增殖,存活和转移。 Joanna(2018)证明MET的14外显子发生剪切时可以定义为非小细胞肺癌的独特分子亚组,导致肿瘤预后较差,而使用MET抑制剂可能使这一特定亚组的患者受益[29]。以上研究证明,特定的R可变剪切事件可能是肿瘤重要的生物标志物,可以作为预测患者预后的重要指标。因此,我们进行了系统的分析,阐明了可变剪切在非小细胞肺癌的致癌作用中发挥重要作用,并挖掘出几个特定的剪切事件可以作为后续实验的研究方向。
此外,性别是影响肿瘤预后的重要因素[30, 31],研究表明,从病因学到解剖病理学以及治疗结果等方面来看,男性和女性肺癌患者均有一些不同的特征。无论在疾病阶段,组织学情况或者吸烟状态如何,非小细胞肺癌的女性患者的生存率均高于男性患者,并且在接受多种方式治疗(如手术,放疗,姑息性铂类化学疗法或EGFR TKI治疗)的NSCLC患者中均发现女性具有更好的的生存优势。然而,女性患者可能比男性更容易受到烟草等致癌物的影响,研究发现雌激素所诱发的细胞色素P-4501A1(CYP1A1)表达增加可能是其原因之一。最近在非小细胞肺癌肿瘤样本中进行的下一代高通量测序(NGS)分析证实,女性的TMB低于男性(其中TMB包含大多数致癌驱动因子,例如EGFR,ALK,ROS1,BRAF-V600E和MET外显子14基因的改变等)。在部分研究中,女性可作为肺肿瘤独立的保护性因素[32, 33]。那么,女性非小细胞肺癌患者与男性非小细胞肺癌患者究竟在可变剪切方面有何异同?目前还未有相关的研究和报道。因此,我们尝试从不同性别和不同亚型角度综合评估可变剪切在非小细胞肺癌中所扮演的角色。经过分析,分类后的四个亚组中可变剪切的发生各自具有独特的特征,并且仅仅只有一小部分的差异剪切事件能够影响肿瘤的预后。随后,我们为每个亚组构建了多因素Cox风险比例回归模型,经过检验均表现出良好的预测能力。此外,通过多因素Cox分析所筛选到的剪切事件均可以被视为独立的预后指标。我们的研究从数以万计的指标中筛选到极具价值的几个剪切事件,为后续学者研究可变剪切在非小细胞肺癌中的作用提供了重要的指导,避免了以往只能靠大规模试验才能得到几个有价值的生物标志物的困境。
Nomogram是一种可视化,便于操作的新型预后模型,可以根据患者的特征预测复发或事预后。目前,已有多个研究证明Nomogram模型在肺癌有着良好的预测效果,例如EGFR突变模型以及非细胞毒性化学增敏剂模型[34, 35]。为了使我们的多因素Cox风险比例回归模型在临床实践中更加实用且有效,我们最终建立了由年龄,病理学分期,TNM分期和可变剪切模型组成的Nomogram模型,用于个性化评估病人的预后与复发风险。
此外,我们进行了功能富集分析和上游调控网络,以探讨与可变剪切在非小细胞肺癌中致癌的潜在机制。GO和KEGG分析表明,不同肿瘤类型以及不同性别之间在可变剪切所导致的致癌作用存在差异。通常认为,众多可变剪切的发生是由少数剪接因子导致的,这些剪接因子可以识别剪接信号并与pre-mRNA结合,随后通过剪切产生协同或是拮抗的多种转录本,各种转录本占比不同时,将体现出不同的功能。为了探索可变剪切的上游调控机制,我们在差异表达的剪接因子与差异表达的预后相关剪接事件之间构建了一个剪接相关网络。这些上下游调控机制的探索,将可变剪切在非小细胞肺癌中发挥作用的可能途径进行了完整的阐述,这些前期工作是十分重要的,它使我们可以针对性的进行后续可变剪切的探索。
HNRNPLL是一种参与mRNA剪接和稳定的RNA结合蛋白。有研究证明,HNRNPLL对结直肠肿瘤的转移有抑制作用,它可以与Cd44的pre-mRNA结合从而抑制肿瘤细胞的上皮-间质转化(EMT)[36]。有趣的是,在我们的预后模型中,AT_HNRNPLL是一种风险因素(HR > 1),并且在我们收集到的组织验证中确实在肿瘤中被上调。这里要解释AT类型的剪切事件作用机制,AT是通过剪切改变转录本翻译的终止位点,因此,我们推测AT的发生导致HNRNPLL提前终止并失去其原始功能,该转录本的增加削弱或拮抗了抑癌作用的发生。
HPCAL1是一种神经钙信号传导蛋白,研究者发现它在多形性胶质母细胞瘤的组织和细胞中被Ca2 +上调。此外它可以通过激活Wnt/β-catenin途径以及促进c-Myc基因的表达来促进胶质母细胞瘤的增殖[37]。在我们的研究中,ES_HPCAL1事件在肿瘤组织中被上调,并且对肿瘤的预后产生负面影响(HR>1),但是在功能通路的分析中,我们发现MYC抑制途径被激活,这种现象的发生可能是机体为对抗对肿瘤所采取的保护措施。
CCDC88A是苏氨酸/丝氨酸激酶Akt的底物,近来有研究报道它参与胰腺导管腺癌(PDAC)肿瘤细胞的迁移和侵袭。它通过增加PDAC细胞中Src和ERK1 / 2的磷酸化,同时减少AMPK1的磷酸化来发挥作用[38]。经过系统性分析,我们发现RI_CCDC88A作为一种风险因素(HR> 1)在肿瘤组织中被显著上调。不同于PDCA的致癌机制,我们富集到了一些其他经典的重要功能通路,如VEGFR1 / 2,FAK和Wnt途径等。
RPL29在机体的蛋白质合成中扮演重要角色,有研究证明RPL29在结肠肿瘤细胞中被显著上调。 HIP/RPL29的联合抑制将上调p21和p53并诱导细胞分化[39]。在我们的研究中,RI_RPL29作为一种保护因素(HR <1)在肿瘤组织中被上调,并且p53结合信号通路被显着富集。RI类型剪切是保留转录本中的一段内含子,这段内含子的出现可能改变RPL29的翻译后的蛋白质结构,从而导致其原始功能丧失,并可能通过激活p53相关通路起到拮抗肿瘤的作用。
由于时间有限,我们对以上所提的机制探索还不够深入,相关研究已经在计划中开展,这些前期工作为为我们的进一步试验设计提供了重要的理论基础。此外,我们选择的患者完全来自单个数据库的单个队列,并且没有其他队列,特别是具有前瞻性数据的队列来进一步验证模型的效能。
结论
总之,本研究从性别和亚型的角度对NSCLC的可变剪接事件进行了系统分析,我们发现不同性别及不同亚型的非小细胞患者肿瘤细胞发生的可变剪切不尽相同,并且对肿瘤预后的影响也不同,因此,我们针对性设置不同性别不同肿瘤类型的亚组,分别探索了可变剪切对不同亚组中患者预后的影响,构建了不同的临床预测模型,并在矫正中体现出良好的预测效果,此外,我们探索了完整的上下游调控机制,为以后的基础实验提供了可靠的生物标志物。
参考文献
[1] BRAY F, FERLAY J, SOERJOMATARAM I, et al. Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA Cancer J Clin, 2018, 68(6): 394-424.
[2] HERBST R S, MORGENSZTERN D and BOSHOFF C. The biology and management of non-small cell lung cancer[J]. Nature, 2018, 553(7689): 446-454.
[3] BARTA J A, POWELL C A and WISNIVESKY J P. Global Epidemiology of Lung Cancer[J]. Ann Glob Health, 2019, 85(1): .
[4] VARGAS A J and HARRIS C C. Biomarker development in the precision medicine era: lung cancer as a case study[J]. Nat Rev Cancer, 2016, 16(8): 525-537.
[5] JIN Y, DONG H, SHI Y, et al. Mutually exclusive alternative splicing of pre-mRNAs[J]. Wiley Interdiscip Rev RNA, 2018, 9(3): e1468.
[6] BLACK D L. Mechanisms of alternative pre-messenger RNA splicing[J]. Annu Rev Biochem, 2003, 72(291-336.
[7] NILSEN T W and GRAVELEY B R. Expansion of the eukaryotic proteome by alternative splicing[J]. Nature, 2010, 463(7280): 457-463.
[8] KELEMEN O, CONVERTINI P, ZHANG Z, et al. Function of alternative splicing[J]. Gene, 2013, 514(1): 1-30.
[9] CLIMENTE-GONZALEZ H, PORTA-PARDO E, GODZIK A, et al. The Functional Impact of Alternative Splicing in Cancer[J]. Cell Rep, 2017, 20(9): 2215-2226.
[10] KIM E, GOREN A and AST G. Insights into the connection between cancer and alternative splicing[J]. Trends Genet, 2008, 24(1): 7-10.
[11] KIM H K, PHAM M H C, KO K S, et al. Alternative splicing isoforms in health and disease[J]. Pflugers Arch, 2018, 470(7): 995-1016.
[12] KOZLOVSKI I, SIEGFRIED Z, AMAR-SCHWARTZ A, et al. The role of RNA alternative splicing in regulating cancer metabolism[J]. Hum Genet, 2017, 136(9): 1113-1127.
[13] HANAHAN D and WEINBERG R A. Hallmarks of cancer: the next generation[J]. Cell, 2011, 144(5): 646-674.
[14] LIN J C. Therapeutic Applications of Targeted Alternative Splicing to Cancer Treatment[J]. Int J Mol Sci, 2017, 19(1): .
[15] MARTINEZ-MONTIEL N, ROSAS-MURRIETA N H, ANAYA RUIZ M, et al. Alternative Splicing as a Target for Cancer Treatment[J]. Int J Mol Sci, 2018, 19(2): .
[16] PORAZINSKI S and LADOMERY M. Alternative Splicing in the Hippo Pathway-Implications for Disease and Potential Therapeutic Targets[J]. Genes (Basel), 2018, 9(3): .
[17] MAO S, LI Y, LU Z, et al. Survival-associated alternative splicing signatures in esophageal carcinoma[J]. Carcinogenesis, 2019, 40(1): 121-130.
[18] PARK S Y. Nomogram: An analogue tool to deliver digital knowledge[J]. J Thorac Cardiovasc Surg, 2018, 155(4): 1793.
[19] RYAN M, WONG W C, BROWN R, et al. TCGASpliceSeq a compendium of alternative mRNA splicing in cancer[J]. Nucleic Acids Res, 2016, 44(D1): D1018-1022.
[20] LAW C W, ALHAMDOOSH M, SU S, et al. RNA-seq analysis is easy as 1-2-3 with limma, Glimma and edgeR[J]. F1000Res, 2016, 5(.
[21] LEX A, GEHLENBORG N, STROBELT H, et al. UpSet: Visualization of Intersecting Sets[J]. IEEE Trans Vis Comput Graph, 2014, 20(12): 1983-1992.
[22] TIBSHIRANI R J J O T R S S S B. Regression shrinkage and selection via the lasso[J]. 1996, 58(1): 267-288.
[23] PIVA F, GIULIETTI M, BURINI A B, et al. SpliceAid 2: a database of human splicing factors expression data and RNA target motifs[J]. Hum Mutat, 2012, 33(1): 81-85.
[24] LOVE M I, HUBER W and ANDERS S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2[J]. Genome Biol, 2014, 15(12): 550.
[25] DEL VESCOVO V and DENTI M A. microRNA and Lung Cancer[J]. Adv Exp Med Biol, 2015, 889(153-177.
[26] NIE W, GE H J, YANG X Q, et al. LncRNA-UCA1 exerts oncogenic functions in non-small cell lung cancer by targeting miR-193a-3p[J]. Cancer Lett, 2016, 371(1): 99-106.
[27] LI Y, SUN N, LU Z, et al. Prognostic alternative mRNA splicing signature in non-small cell lung cancer[J]. Cancer Lett, 2017, 393(40-51.
[28] BOUDRIA A, ABOU FAYCAL C, JIA T, et al. VEGF165b, a splice variant of VEGF-A, promotes lung tumor progression and escape from anti-angiogenic therapies through a beta1 integrin/VEGFR autocrine loop[J]. Oncogene, 2019, 38(7): 1050-1066.
[29] TONG J H, YEUNG S F, CHAN A W, et al. MET Amplification and Exon 14 Splice Site Mutation Define Unique Molecular Subgroups of Non-Small Cell Lung Carcinoma with Poor Prognosis[J]. Clin Cancer Res, 2016, 22(12): 3048-3056.
[30] MICHELI A, CIAMPICHINI R, OBERAIGNER W, et al. The advantage of women in cancer survival: an analysis of EUROCARE-4 data[J]. Eur J Cancer, 2009, 45(6): 1017-1027.
[31] COOK M B, MCGLYNN K A, DEVESA S S, et al. Sex disparities in cancer mortality and survival[J]. Cancer Epidemiol Biomarkers Prev, 2011, 20(8): 1629-1637.
[32] SAKURAI H, ASAMURA H, GOYA T, et al. Survival differences by gender for resected non-small cell lung cancer: a retrospective analysis of 12,509 cases in a Japanese Lung Cancer Registry study[J]. J Thorac Oncol, 2010, 5(10): 1594-1601.
[33] SAGERUP C M, SMASTUEN M, JOHANNESEN T B, et al. Sex-specific trends in lung cancer incidence and survival: a population study of 40,118 cases[J]. Thorax, 2011, 66(4): 301-307.
[34] GIRARD N, SIMA C S, JACKMAN D M, et al. Nomogram to predict the presence of EGFR activating mutation in lung adenocarcinoma[J]. Eur Respir J, 2012, 39(2): 366-372.
[35] VILLALONA-CALERO M A, OTTERSON G A, WIENTJES M G, et al. Noncytotoxic suramin as a chemosensitizer in patients with advanced non-small-cell lung cancer: a phase II study[J]. Ann Oncol, 2008, 19(11): 1903-1909.
[36] SAKUMA K, SASAKI E, KIMURA K, et al. HNRNPLL, a newly identified colorectal cancer metastasis suppressor, modulates alternative splicing of CD44 during epithelial-mesenchymal transition[J]. Gut, 2018, 67(6): 1103-1111.
[37] ZHANG D, LIU X, XU X, et al. HPCAL1 promotes glioblastoma proliferation via activation of Wnt/beta-catenin signalling pathway[J]. J Cell Mol Med, 2019, 23(5): 3108-3117.
[38] TANOUCHI A, TANIUCHI K, FURIHATA M, et al. CCDC88A, a prognostic factor for human pancreatic cancers, promotes the motility and invasiveness of pancreatic cancer cells[J]. J Exp Clin Cancer Res, 2016, 35(1): 190.
[39] LIU J J, HUANG B H, ZHANG J, et al. Repression of HIP/RPL29 expression induces differentiation in colon cancer cells[J]. J Cell Physiol, 2006, 207(2): 287-292.
可变剪切在疾病中的最新研究
引言
到目前为止,研究者发现人类基因组共包含约21,000个编码蛋白质的基因[40]。然而,生物体的功能机制是复杂且多样的,仅仅这些蛋白显然并不能满足机体的需要。可变剪切便是满足上述需要的一种保守的生物学过程,它通过删除前体RNA分子中的内含子,并连接一系列外显子从而形成成熟的mRNA,一个典型的例子为果蝇中的Dscam基因,它可以通过可变剪切产生多达38,016种不同的转录本[41]。有趣的是,几乎所有人类基因的转录本都经过可变剪切,并能够产生多种类型的转录本,通过这种方式可将人类蛋白质的组成范围扩大约10倍[7]。此外,可变剪切的另一个重要作用是通过产生导致mRNA衰变的框架外产物来调节mRNA表达。可变剪切剪切除了在细胞的分化[42]与衰老[43]过程中扮演重要角色,对于维持机体各种功能包括神经系统[44],免疫系统[45],代谢系统[12]的稳定也具有重要作用,当该功能失调时,将会诱发各种疾病以及肿瘤的发生。
1.可变剪切的发展过程
在1990年代后期,通过全长mRNA片段化的表达序列标签测序揭示了真核生物中广泛存在的可变剪切模式。在2000年代中期,剪切敏感的微阵列技术得以发展,研究人员能够检测细胞、组织和物种的全方位可变剪切。但是,这些技术存在通量低,干扰信号多的问题,并且只能识别已知的剪切事件。在2000年代后期,第三代测序方法的出现及其应用奠定了转录组学啥基础。随着新的转录组学方法的发展,多个大型国际机构,例如ENCODE,FANTOM,TCGA等,将目标放在人类基因组功能特征的研究之上,提出了基因表达过程中前所未有的观点,甚至重新定义了基因等概念。目前已有多种计算工具已被开发,他们通过读取RNA-seq数据来估计mRNA转录本的亚型并计算可变剪切。剪切百分比(PSI)是最常用的表示可变剪切的方式,它表示包含特定外显子的mRNA转录本在所有转录本中所占的百分比[46]。
2.可变剪切的作用机制
mRNA前剪切的调控是一个多步骤且复杂的过程。在该过程中的重要因素是定义外显子的5′-和3′-剪切识别位点[47]。另外,内含子的去除取决于剪切调节元件(SRE),其被分为组成性和辅助序列。pre-mRNA分子具有特定的已定义二级结构,可导致单个调控元件的暴露或掩盖。由于pre-mRNA中存在弱的5′-或3′-剪切位点或被掩盖的SRE位点,可能会导致其他剪切。当pre-mRNA中编码区的新长度不能被三除时,结果将是启动子和终止密码子的提前或是废除,从而使开放阅读框发生移位。常见的七种方式包括:外显子跳跃、5‘端延伸、3’端延伸、内含子保留、启动子改变、终止子改变以及外显子互斥。由于可变剪切会产生许多不同的mRNA同工型,因此剪切必须具有足够的灵活性并同时能够拥有惊人的高保真度[48]。可变剪切受顺式作用元件和反式作用元件控制,其中pre-mRNA附近或内部的调控序列被认为是顺式作用元件。该组包括剪切增强子(SE)和沉默子(SS),它们可以位于外显子(ESE,ESS)和内含子(ISS,ISE)中。顺式调节元件也可与反式作用因子相互作用,反式作用因子可分为两组:分别由富含丝氨酸(SR)的蛋白和hnRNP蛋白代表的SE和SS。SR蛋白的特征在于富含丝氨酸和精氨酸的结构域,并包含一个或两个RNA识别基序(RRM),它们负责识别特定的mRNA序列。hnRNP蛋白属于一个大的蛋白质家族,用从A到U的字母命名。与SR蛋白类似,hnRNP除了KH结构域, RGG框和quasi-RRM结构域外,还包含RRM域。它们都是RNA结合结构域(RBD)。有研究者提出可变剪切的调节是通过蛋白-蛋白互作来募集剪切蛋白到5′端-剪接位点和3′端-剪接位点,比如,富含丝氨酸和精氨酸的结构域被认为负责结合BP和募集剪接体蛋白[49]。近来,研究者发现非编码RNA也参与可变剪切。长链非编码RNA主要是通过三种方式影响可变剪切:1)与特定剪切因子相互作用; 2)与pre-mRNA分子形成RNA-RNA复合体;3)影响染色质重塑,从而微调靶基因的剪接。长链非编码来源的小RNA(smRNA)通过smRNA-蛋白质相互作用和碱基配对识其mRNA靶标发挥作用[50]。
3.可变剪切在常见疾病中作用
3.1 骨骼肌系统
骨骼肌的形成由多个步骤组成,受到肌肉特异性和普遍存在的转录因子(TF)的复杂网络的严格控制。TF的特定组合决定了骨骼肌发育和产后肌肉生长各个方面的基因表达程序。TF的功能受到多种分子和生化机制的调控,可变剪切便是一种重要的调控途径。可变剪切主要通过两种主要方式影响TF结构:1)改变其DNA结合结构域;2)与辅因子相互作用并改变其结构域。这样的改变导致DNA结合特异性或亲和力的改变,或导致同一TF在活化剂和阻遏物同工型之间进行转换[51]。
Pax家族中,除Pax4和Pax9外,所有Pax基因均产生多种剪接转录本,可编码结构和DNA结合活性不同的PAX蛋白。Pax3和Pax7基因属于III组,并具有相似的结构。它们都在N末端处进行可变剪切,从而产生影响发育过程不同的同工型。在横纹肌肉瘤(RMS),不同肿瘤亚型(ERMS和ARMS)具有不同的PAX3 / 7同工型,其恶性程度也有所不同。
此外,NFIX转录因子属于核因子I(NFI)家族,在肌肉发育中具有关键作用。NFI表达有多个剪接变体,他们在N端共享一个保守的DNA结合和二聚结构域,在C末端共享一个转录激活/抑制域。有研究表明,Nfix同工型的的转变可能导致马歇尔-史密斯综合征(MSS),其特征为骨骼肌发育缓慢且张力低下。
3.2代谢系统
胰岛素受体属于受体酪氨酸激酶的一个亚家族,在细胞生长,分化和代谢的调节中起着重要的作用。人胰岛素受体存在两种同工型,不同之处在于外显子11的存在。外显子11在胰岛素受体的C末端编码12个氨基酸,并随着发育和组织变化发生可变剪切。简而言之,缺乏外显子11的A型胰岛素受体(IR-A)的表达促进生长和胎儿发育,而IR-B主要在分化良好的成人组织(例如肝脏)中表达以发挥代谢性胰岛素作用。IR-A和IR-B对胰岛素的结合亲和力相似,但对胰岛素样生长因子(IGF)-2和胰岛素原的亲和力却不同。动物实验发现,高胰岛素血症猴子的肌肉中IR-A水平高于非高胰岛素血症对照组,而糖尿病猴的肝脏中IR-A水平升高,并与空腹血糖和静脉内葡萄糖下降显著相关。此外,有研究证明低热量饮食、减肥手术或是减轻体重时,IR-B增加且IR-B的表达与空腹胰岛素水平呈负相关。关于作用机制,有研究表明富含丝氨酸和精氨酸的剪接因子3(SRSF3,也称为SRP20)在调节胰岛素受体外显子11跳跃中起着重要作用,当SFSR3过表达将导致11外显子保留,而敲除SRSF3则导致11外显子发生跳跃[52]。
最近的研究表明,肥胖受试者的各个器官中几种RNA发生可变剪切。RBFOX2编码一种RNA结合蛋白,该蛋白与受调控的外显子或侧翼内含子中的保守元件(U)GCAUG延伸结合,并促进U1 snRNP的募集至50多个剪接位点,并导致成熟的转录本发生外显子替代。对1型糖尿病小鼠心脏的全基因的可变剪接图谱进行分析,结果发现相应的RBFOX2蛋白水平提高。糖尿病心脏中,蛋白激酶C的激活会增加RBFOX2的磷酸化,从而导致胎儿可变剪接程序的重新激活。抑制蛋白激酶C活性会降低RBFOX2蛋白的水平[53]。
简而言之,肥胖患者可变剪切失调的进一步研究可能为这种流行性非传染性疾病提供新颖的诊断和治疗工具。
3.3肾脏系统
血管内皮生长因子A(VEGF-A)是血管生成,通透性,迁移和细胞存活的关键驱动力。在多种类型的肾脏疾病中,都发现了VEGF-A的异常表达。VEGF-A基因由八个外显子和七个内含子组成,通过可变剪切的产物通常被称为VEGF-Axxx(VEGF-A121,VEGF-A145,VEGF-A165,VEGF-A189和VEGF-A206-数字表示氨基酸的数量。直到2002年,研究者在VEGF-A基因第8外显子的3‘端发现新的剪接位点,它创建了一个新的开放阅读框,并因此产生功能不同的同种型家族,称为VEGF-Axxxb家族。尽管VEGF-Axxxb亚型具有相同数量的氨基酸,但它们的C端序列发生了变化,导致六个氨基酸发生改变。末端六个氨基酸的这种微小变化导致VEGF-Axxxb具有与VEGF-Axxx功能相反的特性。VEGF-Axxxb具有抗血管生成,抗渗透性和抗迁移特性。
在肾小球中,VEGF-A是维持正常功能的关键因子,主要由成熟的足细胞表达,穿过肾小球基底膜(GBM)与肾小球内皮细胞(GEnCs)表面的VEGFR-2受体结合。在生理正常的肾脏中,尽管足细胞VEGF-A的表达水平很高,但没有血管生成。其原因猜测是足细胞表达与VEGF-A的促血管生成功能相反的同工型,以维持肾小球滤过屏障(GFB)的正常功能。最近,研究者发现在慢行肾炎中,患者VEGF-Axxx / VEGF-Axxxb剪切体比率发生变化。糖尿病性肾病(DN)患者肾功能下降时中,其VEGF-Axxx / VEGF-Axxxb剪切体比率升高。此外,慢性肾炎中VEGF-A外显子8可变剪切失调的另一个例子是Denys-Drash综合征。在健康的足细胞中,WT1与SRPK1启动子结合并抑制SRPK1的表达。然而,在WT1突变体的足细胞中,由于WT1突变,SRPK1并未受到抑制而导致VEGF-A165b减少,从而导致Denys-Drash综合征[54]。
3.4神经系统
在老年人的神经退行性疾病中,最常见的是阿尔茨海默氏病(AD),在过去的几十年中,其发生率急剧上升。AD是一种进行性神经变性,其特征在于认知障碍,记忆力减退,注意力和语言能力下降,以及日常工作绩效降低。最近的研究已经确定了剪切信号和反式作用因子的变化,会扰乱AD患者的可变剪切过程。从AD和健康个体的背外侧前额叶皮层(DLPFC)提取的RNA的深度测序分析最近确定了与AD和衰老相关的可变事件,已经检测到87个内含子簇在AD脑中发生了剪接。这些内含子属于84个基因,其中11个也在AD脑中差异表达。与AD剪接变异相关的SNP被称为剪接定量性状基因座(sQTL)。尽管RNA-seq方法具有很高的参考价值,但它存在一个问题,即RNA必须从主要来自AD晚期患者的验尸后脑组织中提取出来,这一问题使人们感到困惑。克服此局限性的策略是在SNP或sQTL与其他定量AD参数之间建立关联,例如在活着的患者中通过神经成像或AD生物标记物揭示的大脑中的β-淀粉样蛋白(βA)肽沉积。当然,目前距离研究可变剪切对AD的有效疗法还有一定距离,其主要原因是现有的动物模型无法如实地概括疾病的复杂性,但是相关研究为AD提供了一种全新的发病机理,提出了一种新的思路[55]。
3.5感染
免疫激活是宿主应对病原体感染的重要基础,在免疫细胞活化过程中,已经发现几种特定的可变剪接事件会决定免疫激活过程。
病毒编码因子可以调节顺式和反式调节剪接因子之间的复杂相互作用,从而促进相关基因的表达并影响机体防御动态平衡,这种相互作用已经在乳头瘤病毒,腺病毒和艾滋病毒中得到验证[56-59]。大多数病毒依靠宿主的剪接机制从其有限的基因组中产生多种蛋白质。在许多情况下,病毒编码剪接位点与人类剪接位点共有序列匹配,从而有效地驱动剪接机制优先朝需要剪接的病毒premRNA延伸。例如,人类细小病毒B19的内含子剪接增强子2(ISE2)区域具有一个RNA结合基序共有位点(5′-UGUGUG-3’),它利用宿主因子RBM38在病毒复制过程中对其前mRNA进行加工;甲型流感病毒的NS1蛋白与CPSF(CPSF30)的30 kDa亚基结合,通过这种相互作用实现3’末端的可变剪切加工,从而全面抑制细胞的聚腺苷酸化。某些RNA病毒可在细胞质内实现独立复制而不依靠宿主的剪接机制。但是,它们所产生的蛋白质可能与宿主剪接因子相互作用,从而调节宿主的剪接作用。例如,哺乳动物呼肠孤病毒感染可导致宿主产生多达240种的可变剪接事件,从而影响宿主关键基因的表达和RNA代谢的调控。在HIV-1感染的情况下,辅助蛋白Tat以DYRK1A依赖的方式直接与TAU RNA相互作用并抑制TAU mRNA中外显子10的包含,从而导致宿主神经认知损害。
近期研究表明,在感染结核分枝杆菌时,宿主巨噬细胞会过表达某些特定的分泌蛋白(如剪接因子hnRNPU,hnRNP H,hnRNP A2 / B1亚型A2和SRSF3)与细菌蛋白mtrA发生免疫共沉淀。此外,研究者发现几种分枝杆菌蛋白(如EsxQ,Apa,Rv1827,LpqN,Rv2074和Rv1816)可诱导巨噬细胞发生裂解,而在此过程中,宿主的RNA剪切蛋白(如SRSF2,SRRM2,SF1,HTATSF1,GCN1L1,CPSF6等)被确定为互作蛋白,这表明分枝杆菌蛋白可能通过与一种或多种剪接因子或辅助蛋白发生物理相互作用而改变宿主RNA剪接[60]。
4.可变剪切在肿瘤中的作用
肿瘤主要发生细胞增殖,分化,复制和死亡的几种代谢过程的改变。肿瘤学研究便是发现导致恶性细胞转化的分子机制。最近的基因组分析表明,肿瘤细胞中有许多分子变化是受到可变剪切的修饰。肿瘤学与可变剪切之间的联系对于理解导致疾病的机制以及改善治疗方法的发展至关重要。
4.1肺癌
目前在肺癌中发现的异常可变剪切主要包括BCL2L1,MDM2,MDM4,NUMB和MET基因的剪接变化,它们涉及凋亡,细胞增殖和细胞趋化等各个途径。此外,通过对RNASeq数据集的系统分析表明,QKI,RBM4,RBM5,RBM6,RBM10和SRSF1蛋白表达的变化导致肺癌中发生诸多异常可变剪切事件。
凋亡是一种细胞程序性死亡的过程,是生物体为应对伤害多作出的至关重要反应。在DNA受到严重破坏的情况下,特别是在突变可能引发恶性癌症之前,生物体必须清除该细胞。许多类型的化学疗法和放射疗法依靠损伤DNA诱导细胞凋亡,这意味着凋亡途径的缺陷可引起肿瘤细胞对治疗的抗性。因此,抗性细胞死亡被认为是与该疾病所有亚型相关的重要标志之一。细胞凋亡可以通过不同的途径被外在或内在的细胞信号诱导。其中,Bcl-2蛋白家族通过形成异源和同源二聚体来调节细胞凋亡。Bcl2L1基因编码的Bcl-X是一种凋亡调节剂,通过调节控制线粒体膜电位的线粒体膜中的电压依赖性阴离子受体来控制细胞死亡。BCL2L1 的pre-mRNA通过剪切合成两个mRNA异构体,它们编码具有完全不同的生理特性的蛋白质。它们是称为抗凋亡同工型(BclXL)和促凋亡同工型(Bcl-XS)。BCL2L1在其促凋亡和抗凋亡同工型之间的转变在SCLC的进展中起着至关重要的作用。Bcl-XL蛋白中的BH1和BH2结构域是与BAX异源二聚化以抑制细胞凋亡所必需的。在Bcl-XS中,BH3结构域对于Bcl-XS的凋亡活性是必需的。
MDM2是一种原癌基因,且在肺癌中过表达。MDM2蛋白与p53结合并指导其蛋白酶体降解。有研究表明,香烟烟雾中发现的致癌物,例如苯并芘[a]和苯并芘[a]二醇环氧化合物,会导致异常MDM2可变剪切,并预示NSCLC的不良预后。目前,MDM2约发现有40多种剪切事件,其中六种发现与肿瘤有关。MDM2-A,-B,-C和-D翻译的蛋白质产物无法结合并灭活p53,而MDM2-E和-FB26产生的蛋白质可以结合p53但不会导致其降解。通过靶向U2和U5 snRNP复合物成分以及U4 / U6·U5 tri-snRNP剪接复合物,破坏剪接体可降低p53阻遏物MDM4和MDM2的蛋白质水平,从而达到稳定p53的目的。
原癌基因MET可以编码酪氨酸受体激酶,该酪氨酸激酶被HGF配体结合激活,以控制RAS / ERK / MAPK和其他信号通路。一旦激活MET就会启动一系列信号转导级联反应,从而促进细胞增殖,减少细胞凋亡,降低细胞凝聚力和诱导菌落扩散,这些都是伤口愈合和胚胎发生的关键过程。研究发现在肺癌中,MET的mRNA转录本常常发生外显子14跳跃方式的可变剪切。METΔ14剪切变体已显示比野生型MET维持更长的配体依赖性信号传导,表明这是一种致癌因素。有趣的是,尽管这种剪切变体会使很多酪氨酸激酶抑制剂失效,但是MET抑制剂仍然对该亚型有效[61]。
4.2乳腺癌
目前已发现有五种剪接因子影响乳腺癌的发生与发展,包括持续增殖,激活侵袭和转移,抵抗细胞死亡,减少细胞能耗和促血管生成。
持续的增殖可能是最关键和研究最多的癌症标志。乳腺癌中,HER2受体过度表达就会导致肿瘤细胞的持续增殖。而当HER2发生可变剪切时,细胞会产生促癌或抗肿瘤功能的不同变体。当剪切事件跳过外显子16时会产生变体HER2D16,该变体与HER2靶向治疗的耐药以及肿瘤细胞扩散有关。
在肿瘤发生或抗癌治疗期间,肿瘤细胞暴露于多种生理压力下。在正常细胞中,这些细胞应激将导致细胞凋亡。但是,癌细胞会适应这种环境并重新安排其凋亡程序以生存。SRSF1通过促进生成凋亡剪切事件BIMγ1和γ2的生成发挥作用。两种同工型均缺乏结合抗凋亡Bcl-2家族成员所必需的BH3结构域。此外,SRSF1将会导致BIN1产生新的亚型使其不能结合MYC,从而失去肿瘤抑制活性,导致凋亡水平降低。同时,SRPK1的上调有助于RNA结合基序蛋白4(RBM4)的积累,导致抗凋亡同工型IR-A和MCL-1L的产生并降低了乳腺癌细胞对凋亡信号的敏感性[62]。
4.3肝癌
在肝癌中发现RNA剪接变化已有超过30年的历史了,目前发现的RNA可变剪切主要包括DNMT3b,AURKB,MDM2,TENSIN2,MAD1,KLF6,SVH,TP73,TP53和FN1等,它们均已在细胞培养实验中显示出促进增殖,防止凋亡和支持转化的功能作用。
最近一项研究通过TCGA数据库获得377个肝癌患者的RNA-seq数据,重新分析肝脏样品的序列数据并评估RNA可变剪切的变化,共发现了约45,000个替代剪接事件。通过进一步的分析,研究者在HBV相关的肝癌病例中发现包含2,051个基因中的3,250个转录物发生可变剪切,在HCV相关的肝癌病例中发现包含907基因中的1,380个转录物发生可变剪切和在非病毒相关的肝癌病例中发现包含1,517个基因发生可变剪切。此外,通过评估了这些样品中的剪接因子表达,发现26种剪接因子的表达发生了改变,包括ESRP2,SRSF2,CELF2,MBNL1,HNRNPA1和HNRNPH等,这与Bhate提出的癌胚转化观点相一致[63]。
4.4前列腺癌
前列腺的正常发育和维持依赖于雄激素,其生成受下丘脑-垂体性腺调节并通过雄激素受体(AR,也称为DHTR或NR3C4)发挥作用。AR属于类固醇受体转录因子家族,包括雌激素受体α(ERα),雌激素受体β(ERβ)和孕激素受体(PR)。目前发现,AR 至少有22个剪接变体,其中最常研究的是AR-V7和ARV567es,两种剪接变体都缺乏C端配体结合域,并使患者对传统的雄激素剥夺疗法产生抵抗力。检测62例肿瘤侵袭转移患者的循环肿瘤细胞,发现AR-V7与AR抑制剂阿比特龙和恩杂鲁胺耐药有显著关联。此外,研究表明剪接因子U2AF65和SRSF1在介导AR-V7表达中起关键作用。
KLF6基因产物(Krüppel因子6,也称为BCD1,COPEB和ZF9)属于Krüppel样锌指转录因子家族,该家族至少由24个成员组成,包括Sp1-like(Sp1-8)和 类KFL因子(KFL1-16),参与调节细胞的分化,增殖和凋亡。该基因位于染色体10p15.2上,该区域在约55%的散发性前列腺腺癌中缺失。KLF6的可变剪接导致产生至少四个剪接同工型。在前列腺癌患者中,该基因内含子1中发生单核苷酸突变时,会为剪接因子SRSF5创建了新的结合位点。这导致在外显子2发生剪切,并产生KLF6-SV1,SV2和SV3三种剪切变体。KLF6-SV没有锌指DNA结合结构域,但保留了大部分N末端结构域。KLF6-SV1是KLF6的拮抗剂,可以促进细胞生长,敲低全长KLF6会增加肿瘤形成,而敲低KLF-SV1会抑制肿瘤形成。此外,前列腺切除术后男性肿瘤中KLF6-SV1表达的增加与较低的存活率和疾病复发相关。同时,研究证明KLF6-SV1的表达增加取决于Ras / PI3-K / Akt细胞信号通路的激活[64]。
4.5中枢神经系统肿瘤
目前的中枢神经系统肿瘤主要涉及胶质母细胞瘤。研究发现,PTBP1(也称为hnRNPI)的高表达及扩增抵消了机体抑癌功能并促进了肿瘤的进展。正常情况下,PTBP1可以导致Brahma/SWI2-related gene 1 (BRG)-associated factor (BAF45d)发生剪切,两者共同影响大脑的发育。但在肿瘤发生时,原癌基因c-MYC可以协同PTBP1和hnRNPs(hnRNPA1和hnRNPA2)参与丙酮酸激酶基因(PKM)的可变剪切。PKM通过促进磷酸烯醇丙酮酸转化为丙酮酸而催化糖酵解途径的最后一步。PKM中外显子9或10发生互斥剪切会产生PKM1或PKM2两种转录本,PKM1通常出现在成人脑中发挥促进氧化磷酸化的作用,而PKM2在胚胎发生过程中发生表达并促进有氧糖酵解。hnRNPs和PTBP1与外显子9侧翼序列的结合促进外显子10的保留使PKM2表达增加,从而增加GBM细胞中高糖酵解通量。促成这种代谢转换的另一个剪接因子是SR蛋白SRSF3,它在神经胶质瘤中也上调,也发挥促进外显子10的保留并促使PKM2表达。最终,PKM2发挥维持神经胶质瘤干细胞(GSC)的生长,自我更新和致瘤性的作用[65]。
5可变剪切的治疗策略
SRSF家族成员包含一个或多个RNA识别基序(RRM)和一个C端精氨酸-丝氨酸重复序列,称为RS结构域。SRSF蛋白参与多个转录后调控过程。据报道,已发现多种SRSF蛋白调控转录本的可变剪切,这些转录本可在不同的癌症中发挥促癌作用。SRSF1是目前研究广泛的剪切蛋白,参与多个剪切过程,包括细胞增殖,凋亡,代谢稳态和相关的信号通路。SRSF1表达增加可以增强细胞周期蛋白D1-ex4转录本的生成,编码致癌同工型细胞周期蛋白D1b,从而诱导细胞增殖,侵袭和转化;SRSF1表达启动BIN1和CASP9的剪切,产生促癌同工型,从而干扰多种癌细胞的凋亡;SRSF1表达可增强由Mnk2和RON基因产生的促癌同工型的相对水平,削弱p38促丝裂原激活的蛋白激酶(MAPK)和雷帕霉素(mTOR)信号转导途径,从而增强不同癌细胞的迁移和侵袭活性。SRSF2(也称SC35)可通过诱导抑癌因子KLF6产生保留外显子1a的转录物,编码DNA结合结构域缺陷型蛋白,从而发挥促癌作用。SRSF3(也称SRp20)的表达介导MCL-1基因产生包含外显子2的MCL-1L同工型,从而在乳腺癌细胞中发挥抗凋亡的作用。另外,SRPK家族被认为是潜在的癌基因,其成员主要包括SRPK1,SRPK2和SRPK3。目前在多种肿瘤中观察到SRPK1和SRPK2的增加,包括乳腺癌,结肠直肠癌,肺癌,卵巢癌,肝细胞癌,胰腺癌,白血病和神经胶质瘤。SRPK家族成员特异性地使SRSF蛋白的RS结构域中的丝氨酸/精氨酸二肽处的丝氨酸残基磷酸化,影响SRSF的转录后调控,从而影响肿瘤细胞的增殖和凋亡。通过使用SRPK家族的激酶抑制剂(例如Cpd-1/2/3和SRPIN340),可以降低SR蛋白的磷酸化,从而减少SRSF2,FAS和VEGF的异常转录本。最近通过大规模筛选鉴定了一系列相关化合物,包括Cpd-1,Cpd-2和Cpd-3,它们可以特异性结合SRPK和CLK家族,此外,一种口服生物利用度好和代谢稳定的化合物(TG693)显示出在癌细胞中抑制SRPK和CLK过度激活的作用。当然,以上治疗策略需要在更大范围的癌细胞中进行临床前测试,以验证其治疗潜力[14]。
6结论
在肿瘤进展过程中,具有不同基因组改变的细胞亚群出现在同一肿瘤块内,这种现象称为肿瘤内异质性。在不适肿瘤发生发展的微环境中,癌细胞亚群表型的可塑性被激活,从而驱动多种功能途径激活,使肿瘤细胞对缺氧,营养缺乏或细胞外环境变化产生相对应的适应性机制。肿瘤异质性这一观点粗略的解释了传统疗法在对抗肿瘤复发和转移扩散方面无效的原因。新一代测序技术的出现为阐明肿瘤调控机制提出了新的思路。可变剪切是对生物学“中心法则”的重要补充和延伸,编码蛋白质的信使RNA的选择性剪接(AS)是真核基因表达中控制蛋白质正常功能的重要调节机制。 它也与线粒体和各种离子通道的生理调节有关。通过可变剪切产生的同工型在维持机体各个系统功能稳定发挥重要作用,对于人体健康至关重要。越来越多的数据突显了剪接异构体在各种疾病(包括神经退行性疾病,癌症,免疫和传染病,心血管疾病和代谢状况)中扮演着重要的角色。弄清可变剪切的发生和特定肿瘤表型的关联是未来肿瘤学研究的挑战。随着对可变剪切的深入了解,多种有效的生物标志物已被发掘和用于判断肿瘤患者的复发及预后。此外,可变剪切的复杂性又为研发新型治疗方法提供了多种可能性。实际上,近年来该领域已经取得了重要的里程碑,并且正在开发靶向治疗剂,前期实验证明,多种抑制物可以有效地改变组织可变剪切的方向从而发挥重要作用。相信在不久的将来,可变剪切会为人们更好的理解和治疗肿瘤提供重要帮助。
综述参考文献
[1] BRAY F, FERLAY J, SOERJOMATARAM I, et al. Global cancer statistics 2018: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA Cancer J Clin, 2018, 68(6): 394-424.
[2] HERBST R S, MORGENSZTERN D and BOSHOFF C. The biology and management of non-small cell lung cancer[J]. Nature, 2018, 553(7689): 446-454.
[3] BARTA J A, POWELL C A and WISNIVESKY J P. Global Epidemiology of Lung Cancer[J]. Ann Glob Health, 2019, 85(1): .
[4] VARGAS A J and HARRIS C C. Biomarker development in the precision medicine era: lung cancer as a case study[J]. Nat Rev Cancer, 2016, 16(8): 525-537.
[5] JIN Y, DONG H, SHI Y, et al. Mutually exclusive alternative splicing of pre-mRNAs[J]. Wiley Interdiscip Rev RNA, 2018, 9(3): e1468.
[6] BLACK D L. Mechanisms of alternative pre-messenger RNA splicing[J]. Annu Rev Biochem, 2003, 72(291-336.
[7] NILSEN T W and GRAVELEY B R. Expansion of the eukaryotic proteome by alternative splicing[J]. Nature, 2010, 463(7280): 457-463.
[8] KELEMEN O, CONVERTINI P, ZHANG Z, et al. Function of alternative splicing[J]. Gene, 2013, 514(1): 1-30.
[9] CLIMENTE-GONZALEZ H, PORTA-PARDO E, GODZIK A, et al. The Functional Impact of Alternative Splicing in Cancer[J]. Cell Rep, 2017, 20(9): 2215-2226.
[10] KIM E, GOREN A and AST G. Insights into the connection between cancer and alternative splicing[J]. Trends Genet, 2008, 24(1): 7-10.
[11] KIM H K, PHAM M H C, KO K S, et al. Alternative splicing isoforms in health and disease[J]. Pflugers Arch, 2018, 470(7): 995-1016.
[12] KOZLOVSKI I, SIEGFRIED Z, AMAR-SCHWARTZ A, et al. The role of RNA alternative splicing in regulating cancer metabolism[J]. Hum Genet, 2017, 136(9): 1113-1127.
[13] HANAHAN D and WEINBERG R A. Hallmarks of cancer: the next generation[J]. Cell, 2011, 144(5): 646-674.
[14] LIN J C. Therapeutic Applications of Targeted Alternative Splicing to Cancer Treatment[J]. Int J Mol Sci, 2017, 19(1): .
[15] MARTINEZ-MONTIEL N, ROSAS-MURRIETA N H, ANAYA RUIZ M, et al. Alternative Splicing as a Target for Cancer Treatment[J]. Int J Mol Sci, 2018, 19(2): .
[16] PORAZINSKI S and LADOMERY M. Alternative Splicing in the Hippo Pathway-Implications for Disease and Potential Therapeutic Targets[J]. Genes (Basel), 2018, 9(3): .
[17] MAO S, LI Y, LU Z, et al. Survival-associated alternative splicing signatures in esophageal carcinoma[J]. Carcinogenesis, 2019, 40(1): 121-130.
[18] PARK S Y. Nomogram: An analogue tool to deliver digital knowledge[J]. J Thorac Cardiovasc Surg, 2018, 155(4): 1793.
[19] RYAN M, WONG W C, BROWN R, et al. TCGASpliceSeq a compendium of alternative mRNA splicing in cancer[J]. Nucleic Acids Res, 2016, 44(D1): D1018-1022.
[20] LAW C W, ALHAMDOOSH M, SU S, et al. RNA-seq analysis is easy as 1-2-3 with limma, Glimma and edgeR[J]. F1000Res, 2016, 5(.
[21] LEX A, GEHLENBORG N, STROBELT H, et al. UpSet: Visualization of Intersecting Sets[J]. IEEE Trans Vis Comput Graph, 2014, 20(12): 1983-1992.
[22] TIBSHIRANI R J J O T R S S S B. Regression shrinkage and selection via the lasso[J]. 1996, 58(1): 267-288.
[23] PIVA F, GIULIETTI M, BURINI A B, et al. SpliceAid 2: a database of human splicing factors expression data and RNA target motifs[J]. Hum Mutat, 2012, 33(1): 81-85.
[24] LOVE M I, HUBER W and ANDERS S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2[J]. Genome Biol, 2014, 15(12): 550.
[25] DEL VESCOVO V and DENTI M A. microRNA and Lung Cancer[J]. Adv Exp Med Biol, 2015, 889(153-177.
[26] NIE W, GE H J, YANG X Q, et al. LncRNA-UCA1 exerts oncogenic functions in non-small cell lung cancer by targeting miR-193a-3p[J]. Cancer Lett, 2016, 371(1): 99-106.
[27] LI Y, SUN N, LU Z, et al. Prognostic alternative mRNA splicing signature in non-small cell lung cancer[J]. Cancer Lett, 2017, 393(40-51.
[28] BOUDRIA A, ABOU FAYCAL C, JIA T, et al. VEGF165b, a splice variant of VEGF-A, promotes lung tumor progression and escape from anti-angiogenic therapies through a beta1 integrin/VEGFR autocrine loop[J]. Oncogene, 2019, 38(7): 1050-1066.
[29] TONG J H, YEUNG S F, CHAN A W, et al. MET Amplification and Exon 14 Splice Site Mutation Define Unique Molecular Subgroups of Non-Small Cell Lung Carcinoma with Poor Prognosis[J]. Clin Cancer Res, 2016, 22(12): 3048-3056.
[30] MICHELI A, CIAMPICHINI R, OBERAIGNER W, et al. The advantage of women in cancer survival: an analysis of EUROCARE-4 data[J]. Eur J Cancer, 2009, 45(6): 1017-1027.
[31] COOK M B, MCGLYNN K A, DEVESA S S, et al. Sex disparities in cancer mortality and survival[J]. Cancer Epidemiol Biomarkers Prev, 2011, 20(8): 1629-1637.
[32] SAKURAI H, ASAMURA H, GOYA T, et al. Survival differences by gender for resected non-small cell lung cancer: a retrospective analysis of 12,509 cases in a Japanese Lung Cancer Registry study[J]. J Thorac Oncol, 2010, 5(10): 1594-1601.
[33] SAGERUP C M, SMASTUEN M, JOHANNESEN T B, et al. Sex-specific trends in lung cancer incidence and survival: a population study of 40,118 cases[J]. Thorax, 2011, 66(4): 301-307.
[34] GIRARD N, SIMA C S, JACKMAN D M, et al. Nomogram to predict the presence of EGFR activating mutation in lung adenocarcinoma[J]. Eur Respir J, 2012, 39(2): 366-372.
[35] VILLALONA-CALERO M A, OTTERSON G A, WIENTJES M G, et al. Noncytotoxic suramin as a chemosensitizer in patients with advanced non-small-cell lung cancer: a phase II study[J]. Ann Oncol, 2008, 19(11): 1903-1909.
[36] SAKUMA K, SASAKI E, KIMURA K, et al. HNRNPLL, a newly identified colorectal cancer metastasis suppressor, modulates alternative splicing of CD44 during epithelial-mesenchymal transition[J]. Gut, 2018, 67(6): 1103-1111.
[37] ZHANG D, LIU X, XU X, et al. HPCAL1 promotes glioblastoma proliferation via activation of Wnt/beta-catenin signalling pathway[J]. J Cell Mol Med, 2019, 23(5): 3108-3117.
[38] TANOUCHI A, TANIUCHI K, FURIHATA M, et al. CCDC88A, a prognostic factor for human pancreatic cancers, promotes the motility and invasiveness of pancreatic cancer cells[J]. J Exp Clin Cancer Res, 2016, 35(1): 190.
[39] LIU J J, HUANG B H, ZHANG J, et al. Repression of HIP/RPL29 expression induces differentiation in colon cancer cells[J]. J Cell Physiol, 2006, 207(2): 287-292.
[40] MORAES F and GOES A. A decade of human genome project conclusion: Scientific diffusion about our genome knowledge[J]. Biochem Mol Biol Educ, 2016, 44(3): 215-223.
[41] PARK J W and GRAVELEY B R. Complex alternative splicing[J]. Adv Exp Med Biol, 2007, 623(50-63.
[42] FISZBEIN A and KORNBLIHTT A R. Alternative splicing switches: Important players in cell differentiation[J]. Bioessays, 2017, 39(6): .
[43] DESCHENES M and CHABOT B. The emerging role of alternative splicing in senescence and aging[J]. Aging Cell, 2017, 16(5): 918-933.
[44] SU C H, D D and TARN W Y. Alternative Splicing in Neurogenesis and Brain Development[J]. Front Mol Biosci, 2018, 5(12.
[45] SHEMESH A, BRUSILOVSKY M, KUNDU K, et al. Splice variants of human natural cytotoxicity receptors: novel innate immune checkpoints[J]. Cancer Immunol Immunother, 2018, 67(12): 1871-1883.
[46] PARK E, PAN Z, ZHANG Z, et al. The Expanding Landscape of Alternative Splicing Variation in Human Populations[J]. Am J Hum Genet, 2018, 102(1): 11-26.
[47] HERTEL K J. Combinatorial control of exon recognition[J]. J Biol Chem, 2008, 283(3): 1211-1215.
[48] FOX-WALSH K L and HERTEL K J. Splice-site pairing is an intrinsically high fidelity process[J]. Proc Natl Acad Sci U S A, 2009, 106(6): 1766-1771.
[49] SHENASA H and HERTEL K J. Combinatorial regulation of alternative splicing[J]. Biochim Biophys Acta Gene Regul Mech, 2019, 1862(11-12): 194392.
[50] ROMERO-BARRIOS N, LEGASCUE M F, BENHAMED M, et al. Splicing regulation by long noncoding RNAs[J]. Nucleic Acids Res, 2018, 46(5): 2169-2184.
[51] IMBRIANO C and MOLINARI S. Alternative Splicing of Transcription Factors Genes in Muscle Physiology and Pathology[J]. Genes (Basel), 2018, 9(2): .
[52] HUANG Z, BODKIN N L, ORTMEYER H K, et al. Altered insulin receptor messenger ribonucleic acid splicing in liver is associated with deterioration of glucose tolerance in the spontaneously obese and diabetic rhesus monkey: analysis of controversy between monkey and human studies[J]. J Clin Endocrinol Metab, 1996, 81(4): 1552-1556.
[53] NUTTER C A, JAWORSKI E A, VERMA S K, et al. Dysregulation of RBFOX2 Is an Early Event in Cardiac Pathogenesis of Diabetes[J]. Cell Rep, 2016, 15(10): 2200-2213.
[54] STEVENS M and OLTEAN S. Modulation of VEGF-A Alternative Splicing as a Novel Treatment in Chronic Kidney Disease[J]. Genes (Basel), 2018, 9(2): .
[55] BIAMONTI G, AMATO A, BELLONI E, et al. Alternative splicing in Alzheimer’s disease[J]. Aging Clin Exp Res, 2019, .
[56] BIASIOTTO R and AKUSJARVI G. Regulation of human adenovirus alternative RNA splicing by the adenoviral L4-33K and L4-22K proteins[J]. Int J Mol Sci, 2015, 16(2): 2893-2912.
[57] GRAHAM S V and FAIZO A A A. Control of human papillomavirus gene expression by alternative splicing[J]. Virus Res, 2017, 231(83-95.
[58] STOLTZFUS C M. Chapter 1. Regulation of HIV-1 alternative RNA splicing and its role in virus replication[J]. Adv Virus Res, 2009, 74(1-40.
[59] WU C, KAJITANI N and SCHWARTZ S. Splicing and Polyadenylation of Human Papillomavirus Type 16 mRNAs[J]. Int J Mol Sci, 2017, 18(2): .
[60] CHAUHAN K, KALAM H, DUTT R, et al. RNA Splicing: A New Paradigm in Host-Pathogen Interactions[J]. J Mol Biol, 2019, 431(8): 1565-1575.
[61] COOMER A O, BLACK F, GREYSTOKE A, et al. Alternative splicing in lung cancer[J]. Biochim Biophys Acta Gene Regul Mech, 2019, 1862(11-12): 194388.
[62] READ A and NATRAJAN R. Splicing dysregulation as a driver of breast cancer[J]. Endocr Relat Cancer, 2018, 25(9): R467-r478.
[63] BHATE A, PARKER D J, BEBEE T W, et al. ESRP2 controls an adult splicing programme in hepatocytes to support postnatal liver maturation[J]. Nat Commun, 2015, 6(8768.
[64] PASCHALIS A, SHARP A, WELTI J C, et al. Alternative splicing in prostate cancer[J]. Nat Rev Clin Oncol, 2018, 15(11): 663-675.
[65] BIELLI P, PAGLIARINI V, PIERACCIOLI M, et al. Splicing Dysregulation as Oncogenic Driver and Passenger Factor in Brain Tumors[J]. Cells, 2019, 9(1): .
1、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“文章版权申述”(推荐),也可以打举报电话:18735597641(电话支持时间:9:00-18:30)。
2、网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
3、本站所有内容均由合作方或网友投稿,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务。
原创文章,作者:1158,如若转载,请注明出处:https://www.447766.cn/chachong/140641.html,