service@tgs.org.cn

0755-66814606

首页市场与支持行业动态


LncRNA研究进展



长链非编码RNAs (long non-coding RNAs,lncRNAs)是一类长度大于 200 nt且不表现出蛋白质编码潜能的非编码RNA(Quinn and Chang, 2016)。lncRNA在细胞内表达量低,曾被误认为是转录噪音,但是它们的表达受到发育调控,具有组织和细胞特异性。lncRNA与mRNA结构相似,含有5’帽子与3’ -poly A结构,可发生剪接,但不含有开放阅读框(open reading frame,ORF),所含外显子数目比mRNA少,但外显子长度更长,人类的lncRNA大都含有两个外显子的转录本(Kung et al., 2013)。

lncRNA可与蛋白质、DNA和RNA相互作用,通过基因印记、染色质重塑、细胞周期调控、剪接调控、mRNA降解和翻译调控等多种机制,在表观遗传学、转录调控及转录后调控等多种层面调控基因的表达水平。lncRNA在肿瘤、心脏等疾病的研究应用广泛,是近年来生物学界的研究热点。


一、lncRNA分类(根据基因组来源背景分类)


启动子和增强子是调控基因表达的重要元件。转录时,长度约为200-2000nt的lncRNA短时存在于启动子和增强子的上游。他们主要靶向核内的RNA外切体(RNA exosome, 保守的RNA 的降解复合体,含有3’到5’的核酸外切酶和核酸内切酶活性),具有较大的转换率,所以分析其在基因调控的功能上具有挑战(Wu et al., 2017)。根据lncRNA的基因组位置来源大致可以将lncRNA分为如下六类(图1)(Devaux et al., 2015):

1. lincRNAs(Intergenic lncRNAs) 位于两个蛋白编码基因之间的转录本,大部分lncRNA属于此类;

2. introniclncRNA位于编码基因的一个内含子区;

3. BiodirectionallncRNA是启动子区1kb之内距离,与编码蛋白的转录本的方向相反;

4. elncRNA (enhancer lncRNA) 来源于增强子的转录本,从增强子区双向转录,两个方向都转录等量水平的RNA,长度通常小于2kb;

5. sense lncRNA从编码基因的正义链转录而来,包含了一个或多个内含子和外显子区;

6. antisense lncRNA是从编码基因的反义链转录而来,与蛋白编码基因的mRNA形成互补链,包含了一个或多个内含子和外显子区。

图1 根据基因组的位置的lncRNA的分类(Devaux et al., 2015)


1.PROMPTs

PROMPTs是哺乳动物中蛋白编码基因的转录起始位点TSS上游约0.5-2.5kb的转录本,转录为反义方向。在酵母中相似的转录本称为CUTs( cryptic unstable transcripts)。PROMPTs的转录单位的DNA区包含Pol II 复合物的CTDs结合位点区,与相关的基因区相似,因此PROMPTs含有5’帽子和3’PloyA尾,长度为200-600nt不等,大都富集于细胞核内,并迅速被RNA核内外切体剪切降解(Chen, 2016)。PROMPTs的功能目前不明晰,有报导称在外界胁迫压力下,外切体调节PROMPTs的水平,影响转录因子结合转录的启动子从而调控转录水平。


2.lincRNA

lincRNAs的转录单位位于基因间区,与蛋白质编码的基因位点不重叠。他们具有多个外显子,含有5’帽子、3’ployA尾,可以被剪切,具有不同的可变剪切体,但与mRNA相比具有较少的外显子,不具备蛋白编码能力,表达量更低,保守性也更低,组织特异性表达更高,长度约为1 kb等特征(Quinn and Chang, 2016)。早期的基因组分析认为lincRNA位点与蛋白编码基因在染色质水平上相似,以致系统预测挖掘lncRNA的主要工作(通过判断外显子数量,剪切效率,转录基因位点是否是转录活跃的染色质的特征来鉴定)很难充分地区分lincRNA和mRNA(Chen, 2016)。

最新的研究比较了人类的细胞系中lincRNA与mRNA在转录前体和转录后调控上的特征,发现linRNA与mRNA有如下区别,第一,lincRNA与mRNA相比,有较少的组蛋白修饰位点以及转录因子结合到启动子区的位点,但转录抑制的蛋白修饰位点多;第二,lincRNA的剪切效率更低,可能是因为具有较弱的内部剪切信号;第三,尽管与mRNA相比,lincRNA通常表达量更低,但其稳定性更好(图2所示)(Mele et al., 2017)。另一个最新的研究发现,mRNA转录的Pol II中剪切体的CTD蛋白亚基为磷酸化,且mRNA 3’端依赖于CPSF73剪切并促进转录终止,但大多数转录lincRNAs的Pol II 复合体CTD亚基未磷酸化,并且大多数的lincRNA基因不依赖于CPSF73的终止转录,较少剪切,其在转录过程中发生降解。这解释了为什么lincRNA结合在染色质中并且有较低的表达水平。因此,发挥功能性的lincRNA需逃过在核内的降解并在特殊的细胞中高表达(Schlackow et al., 2017)。

图2 lincRNA与mRNA的比较 (Mele et al., 2017)


3.Natural antisense transcripts, NATs

与mRNA相似且从同一个蛋白编码基因转录,但转录方向相反的lncRNA为反义转录本(sense-antisense,SAS)。例如研究比较多的Xist/Tsix,沉默X染色体的的一对非编码RNAs。大部分反义转录本都可以与正义链重叠,但是NATs更多富集在5’启动子区或者3’终止子区(Kung et al., 2013)。


二、lncRNA调控基因表达的机制及功能



图3 lncRNA发挥功能的分子机制

①lncRNA作为转录因子TFs 或RNAPII的引诱物;
②lncRNA改变转录因子的修饰和定位;
③lncRNA与DNA作用形成三聚螺旋复合物,招募转录的复合物;
④lncRNA作为miRNA的诱导物;
⑤lncRNA作siRNAs或者miRNAs的前体;
⑥lncRNA通过SR复合物调节pre-mRNA的可变剪切;
⑦lncRNA通过与mRNA形成双链的RNA ,防止mRNA 被RNA酶降解;
⑧lncRNA与蛋白修饰因子作用调节组蛋白修饰;
⑨lncRNA结合DNA修饰酶进而对DNA进行甲基化修饰;
⑩lncRNA结合染色质修饰复合物调节染色质的的构象和结合。

整体而言,lncRNA主要从以下三种层面实现对基因表达的调控:


1.表观水平的调控

lncRNA通过结合修饰染色质的蛋白并招募这些修饰蛋白到基因组上的特定位点发挥他们的催化活性,因此可以调控染色质的状态和基因表达。比如小鼠lncRNA Kcnqlot1 可以招募PCR2、G9a,PCR2可以催化H3K4,G9a可以催化H3K9甲基化,两者都为抑制基因的表达的标志。再如HOTAIR的5’端结构域结合PCR2的亚基EZH2(具有甲基转移酶的催化活性),3‘端结合并招募LSD1催化H3K4去甲基化,因此HOTAIR作为scaffold,通过模块化的结构将PCR2和LSD1结合形成RNA-蛋白复合物,使其沉默基因(Lee, 2012)。同样,Xist、Air这些lncRNA也是通过这种方式实现表观遗传学沉默(Mercer and Mattick, 2013)。


2.转录调控

lncRNA的转录能够干扰临近基因的表达。例如在酵母中,SER3基因会受到其上游lncRNA SRG1的转录的干扰,lncRNA能够通过封阻启动子区域来干扰基因的表达。例如,DHFR上游的一个lncRNA能够与DHFR的启动子区域形成RNA-DNA3螺旋结构,进而抑制转录因子TFIID的结合,从而抑制DHFR基因的表达。

lncRNA能够与RNA结合蛋白作用,并将其定位到基因启动子区从而调控基因的表达。例如,CCND1启动子上游一个lncRNA能够调节RNA结合蛋白TLS的活性,进而调控CCND1的表达;lncRNA能够调节转录因子的活性,例如lncRNA Evf2能够与转录因子Dlx2形成转录复合体从而激活Dlx6的表达(Engreitz et al., 2016)。


3.转录后调控

lncRNA对于转录后的调控通过参与剪切调控和翻译控制两种机制。第一,lncRNA通过结合或调整剪切因子,或者直接与mRNA 形成双链的形式调控基因的表达。例如,MIAT(myocardial infarction associated transcript),长度约为9-10kb的lncRNA,含有内含子的分支点序列,可结合SF1(splicing factor 1)抑制剪切过程和剪切复合体的形成。Malat1(metastasis-associated lung adenocarcinoma transcript),可以结合SR剪切因子,拮抗其结合pre-mRNA,影响mRNA的成熟。lncRNA能够与RNA结合蛋白作用,并将其定位到基因启动子区从而调控基因的表达(Luo et al., 2016)。Zeb2(zinc finger E-boxbindinghomeobox 2)蛋白的转录需要保留的一个内含子,含有核糖体的结合位点,Zeb2NAT (Zeb2 natural antisense transcript)能够和Zeb2 mRNA内含子5’剪切位点区域形成双链,从而抑制该内含子的剪切,使Zeb2蛋白表达(Kung et al., 2013)。

miRNA、siRNA通过与mRNA形成互补链可以调控mRNA的转录水平,而lncRNA可以通过结合miRNA、siRNA等小分子RNA,像海绵一样吸附他们,调节他们在细胞内的水平,间接地实现转录后翻译。例如linc-MD1 (long intergenic ncRNAthatis associated with muscle differentiation),作为miR-133和miR-135的海绵吸附体,调节MAML1、MEF2C转录因子的表达,这两个转录因子可以激活肌肉相关的特异性基因表达 (Tay et al., 2014)。


三、lncRNA临床应用


lncRNA在细胞中具有高表达特异性,目前利用GWAS方法分析肿瘤样品,筛选鉴定出许多lncRNAs与不同的肿瘤类型相关联。lncRNA表达水平改变或变异,促进肿瘤的发生和转移。根据lncRNAs在不同组织的特异表达来看,他们可能是肿瘤抑制分子也可能是原癌分子,促进肿瘤的发生,因此lncRNA作为肿瘤的新的分子诊断标志物和药物的靶位点。


1.前列腺肿瘤与lncRNA

GWAS分析筛选出在前列腺肿瘤中表达上调和下调的lncRNA,其中PCA3、PCGEM1和PCAT-1在前列腺肿瘤中高度特异。PCA3(prosteate cancer antigen 3),是一个调控激素类受体的lncRNA,在95%的前列腺肿瘤案例中过表达,而且在恶性和早期的前列腺癌的病人的尿液中高度特异。PC3和PTCH(在前列腺肿瘤中表达)在前列腺肿瘤的外周中上调表达,肿瘤抑制基因Prune2的靶位点是PCA3,其在前列腺癌的组织中表达下调,与PCA3的表达正好相反。PCA3结合PRUME2-pre-mRNA形成双链的RNA招募腺苷脱氨酶,发挥RNA编辑作用,也调控抑癌基因的表达。PCGEM1 (prostate cancer gene expression marker 1) lncRNA在前列腺肿瘤中过表达,促进细胞扩增和克隆的形成 (Bhan et al., 2017)。


2.乳腺癌与lncRNA

HOTAIR是目前研究比较多的lncRNA,目前认为其在乳腺癌、直肠癌、肝癌、非小细胞肺癌中过表达。它是长度为2.2kb的反义lncRNA,主要与两个基因PRC2、LSD1沉默蛋白作用。PRC2的一个亚基EZH2甲基化H3K7,LSD1的H3K4去甲基化都导致基因的沉默。HOTAIR,EZH2,LSD1在乳腺癌中都高度表达,而且HOTAIR抑制肿瘤抑制因子的表达。研究显示HOTAIR是乳腺癌细胞存活必须的,它的表达受到相关的ER调控。


3.肺癌与lncRNA

MALAT1 (metastasis associated lung adenocarcinoma transcript 1)、NEAT2 (nuclear enriched abundant transcript 2),最早在研究非小细胞肺癌中发现,MALAT1在许多不同的物种内表达,在哺乳动物中具有保守性,它可以在转录过程中衍生出小片段的ncRNAs和全长的转录本,定位到细胞核内,影响与剪切相关的SR蛋白的磷酸化,发挥其转录后调控的作用。MALTA在膀胱癌,乳腺癌,前列腺癌和卵巢癌中都有过表达。其中GWAS鉴定出乳腺癌中MALTA1有多个SRSP1结合位点的突变,暗示这些肿瘤的发生可能是剪切的模式发生变化引起的。


4.肝癌与lncRNA

HULC(highly upregulated in liver cancer),长度为1.6kb的原癌性lncRNAs,在肝癌中过表达。从大肠癌转移到肝脏的肿瘤迁移中也发现了HULC转录本的扩增,肝癌的肿瘤和浆液中发现HULC lncRNA都上调,因此它可以作为肝癌诊断的一个潜在标志物。乙肝病毒的携带者易感染性与HULC的SNP相关。有研究发现,HULC作为miR-372的海绵吸附体,抑制了miR-372靶向沉默基因。


5.心脏发育与lncRNA

通过比较胚胎发育时段的RNA-seq数据,发现25% lncRNA在早期胚胎发育过程中具有组织特异性表达模式,尤其在心脏发育的组织中。早期心脏发育过程中的lncRNA的功能与转录调控的信号通路相关,包括NF-kB和CREB通路。


6.阿兹海默症与lncRNA

在对阿兹海默症的研究中找到的一个lncRNABACE1-AS,它编码β分泌酶基因的反义链RNA。β分泌酶能够产生β淀粉样蛋白,后者的累积是阿兹海默症的主要诱因。作为BACE1反义链的BACE1-AS能够在各种外界压力刺激条件下,增加BACE1 mRNA的稳定性(通过防止BACE1受到核酸酶降解的方式),从而导致更多的β淀粉样蛋白累积,并促进BACE1-AS的表达,这个正反馈循环将会加速阿兹海默症的发展。但是,当使用了特异性针对BACE1AS的siRNA降低BACE1-AS的表达水平后,β淀粉样蛋白的表达水平也同时下降了,这表明BACE1-AS是一个非常理想的治疗阿兹海默症的药物靶点(Faghihi1 et al., 2008)。

鉴于lncRNA在转录调控中具有巨大的潜能,在疾病诊断和治疗中作为诊断标记和靶向治疗中表现出来的优势,目前lncRNA的研究正处于火热的研究中,越来越多的新的lncRNA被挖掘。我们恒创基因也针对研究lncRNA开发新的生物信息分析流程,将更好的助力科研,帮助科研工作者,更高效,全面筛选鉴定新的lncRNA及其功能预测。


参考文献
[1] Bhan, A., Soleimani, M., and Mandal, S.S. (2017). Long Noncoding RNA and Cancer: A New Paradigm. Cancer research.
[2] Chen, L.L. (2016). Linking Long Noncoding RNA Localization and Function.Trends in biochemical sciences 41, 761-772.
[3] Engreitz, J.M., Haines, J.E., Perez, E.M., Munson, G., Chen, J., Kane, M., McDonel, P.E., Guttman, M., and Lander, E.S. (2016). Local regulation of gene expression by lncRNA promoters, transcription and splicing. Nature 539, 452-455.
[4] Faghihi1, M.A., Modarresi1, F., Khalil1, A.M., Wood, D.E., Sahagan, B.G., Morgan, T.E., Finch, C.E., III, G.S.L., and Wahlestedt, P.J.K.C. (2008). Expression of a noncoding RNA is elevated in Alzheimer's disease and drives rapid feed-forward regulation of b-secretase. Nature Medicine 14.
[5] Kung, J.T.Y., Colognori, D., and Lee, J.T. (2013). Long Noncoding RNAs: Past, Present, and Future. Genetics 193, 651-669.
[6] Lee, J.T. (2012). Epigenetic regulation by long noncoding RNAs. Science 338, 1435-1439.
[7] Luo, S., Lu, J.Y., Liu, L., Yin, Y., Chen, C., Han, X., Wu, B., Xu, R., Liu, W., Yan, P., et al. (2016). Divergent lncRNAs Regulate Gene Expression and Lineage Differentiation in Pluripotent Cells.Cell stem cell 18, 637-652.
[8] Mele, M., Mattioli, K., Mallard, W., Shechner, D.M., Gerhardinger, C., and Rinn, J.L. (2017). Chromatin environment, transcriptional regulation, and splicing distinguish lincRNAs and mRNAs. Genome research 27, 27-37.
[9] Mercer, T.R., and Mattick, J.S. (2013). Structure and function of long noncoding RNAs in epigenetic regulation.Nature structural & molecular biology 20, 300-307.
[10]Quinn, J.J., and Chang, H.Y. (2016). Unique features of long non-coding RNA biogenesis and function. Nature reviews Genetics 17, 47-62.
[11]Schlackow, M., Nojima, T., Gomes, T., Dhir, A., Carmo-Fonseca, M., and Proudfoot, N.J. (2017).Distinctive Patterns of Transcription and RNA Processing for Human lincRNAs.Molecular cell 65, 25-38.
[12]Tay, Y., Rinn, J., and Pandolfi, P.P. (2014).The multilayered complexity of ceRNA crosstalk and competition. Nature 505, 344-352.
[13]Wu, H., Yang, L., and Chen, L.L. (2017).The Diversity of Long Noncoding RNAs and Their Generation. Trends in genetics : TIG 33, 540-552.
[14]Devaux, Y., Zangrando, J., Schroen, B., Creemers, E.E., Pedrazzini, T., Chang, C.-P., Dorn, G.W., Thum, T., and Heymans, S. (2015). Long noncoding RNAs in cardiac development and ageing. Nature Reviews Cardiology 12, 415-425.
[15]Mele, M., Mattioli, K., Mallard, W., Shechner, D.M., Gerhardinger, C., and Rinn, J.L. (2017). Chromatin environment, transcriptional regulation, and splicing distinguish lincRNAs and mRNAs. Genome research 27, 27-37.
[16]Quinn, J.J., and Chang, H.Y. (2016). Unique features of long non-coding RNA biogenesis and function. Nature reviews Genetics 17, 47-62.

服务
RNA产品
动植物重测序
微生物产品
表观产品
疾病研究
蛋白组学研究
科学
发表文章
关于我们
公司简介
文化与价值观
联系我们
招贤纳士
招聘需求
在线求职
扫一扫,关注我们
 

地址:深圳市盐田区大百汇科技园9层B区   

电话:0755-66814606

©2018 @深圳市恒创基因科技有限公司 粤ICP备14082833号