杭州白癜风专科医院 http://baidianfeng.39.net/bdfby/yqyy/
IdentificationandcharacterizationofcircularRNAsinGanodermalucidum
灵芝中环状RNA的鉴定和表征
期刊:Sci.Rep.(IF=4.)
发表单位:中国医学科学院药植研究所
导读
该项研究是一篇纯测序的描述性分析,首次鉴定并表征了灵芝中circRNA的表达谱。分析结果丰富了灵芝基因组资源,暗示了circRNA在参与灵芝中基因表达调控的潜在功能。
摘要
环状RNA(circRNA)在动物、植物和真菌中起重要作用。但是,灵芝中尚未见到circRNA的报道。本研究使用RNA-Seq数据对灵芝中circRNA进行了全基因组鉴定,并分析了它们的特征。从polyA(-)和polyA(-)/RNaseR处理的文库分别产生的链特异性RNA-seq数据中总共鉴定出50和个circRNA。在灵芝的三个发育阶段中总共表达了00个circRNA。个(16.3%)外显子circRNA及其亲本基因的表达谱显示出显著正相关,而6个(30.9%)外显子circRNA及其亲本基因则表现出显著的负相关,其中53个亲本基因可能参与转录调控、多糖生物合成等。结果表明,circRNA在灵芝中具有潜在的重要调控作用。
前言
随着高通量DNA测序技术和生物信息数据分析方法的发展,circRNA成为近来分子生物学研究的热点。然而,迄今尚未在担子菌中描述circRNA。灵芝是一种经济上重要的药用真菌,其基因组已获得了测序表征,因此已成为研究担子菌生物学的模型物种,这些数据为研究灵芝的生物学提供了基础。然而,灵芝中的circRNA尚未有表征。
本篇研究使用链特异性RNA-seq数据对灵芝中circRNA进行了转录组范围的鉴定,结果提供了灵芝中circRNA的概述,并提供了充分的证据表明circRNA可能参与了广泛生物学过程中基因的表达调控。
材料方法
从灵芝的三个发育阶段(菌丝体、原基和子实体)中提取总RNA,构建了polyA(-)和polyA(-)/RNaseR文库用于circRNA测序。
使用TopHat将cleanreads映射到灵芝参考基因组,使用CIRCexplorer基于反向剪接reads的存在识别circRNA。PCR和Sanger测序用于验证circRNA的真实性。
并对已鉴定的circRNA的各项特征作了详细描述,包括类型、基因组位置、剪接来源、差异表达、与亲本基因的相关性等,如下流程图所示(更详细材料和方法可以在在线补充材料中找到)。
结果
1从两种类型的circRNA鉴定文库生成的数据比较
由于灵芝的circRNA先前并未有过任何注释,作者首先鉴定了可能的circRNA,首先比较了不同RNA文库的识别效率。在菌丝体,原基和子实体中,polyA(-)/RNaseR文库鉴定了、和个circRNA,polyA(-)文库鉴定了17、13和个circRNA,表明polyA(-)/RNaseR文库能够富集更多的circRNA,且大多数circRNA在菌丝体中被鉴定。(polyA(-)/RNaseR文库的效率更高,这是毋庸置疑的。作者还在文中提到,下文分析重点放在从polyA(-)/RNaseR文库中鉴定到的circRNA上)我们也推荐老师们在送样测序时,选择制备polyA(-)/RNaseR文库,可富集更多的circRNA。
图1,使用polyA(?)/两种不同的文库构建方法鉴定circRNA的比较,分别显示在菌丝体(A),原基(B)和子实体(C)中鉴定的circRNA类型数量。
在三个发育阶段中鉴定出的circRNA的比较
作者还在三个发育阶段之间确定circRNA。三个阶段的两个重复实验中共有个circRNA,其中包括个外显子和79个内含子circRNA。种外显子circRNA中分别有种、47种和55种(4.%,11.5%和13.4%)分别在菌丝体、原基和子实体中发现。79种内含子circRNA分别有0种、种和9种(5.3%,7.8%和11.4%)分别在菌丝体、原基和子实体中发现。所有三个阶段共享64个外显子(15.6%)和7个内含子(8.9%)circRNA。图,三阶段circRNA的比较,分别为外显子(A)和内含子(B)circRNA的数量。
3灵芝中circRNA的表征
在识鉴定了circRNA后,作者对它们的结构、类型、基因组分布等作了表征,主要包括以下几点。
分析外显子circRNA的位置,大多数circRNA(98.8%)被定位到基因中间的外显子上,从第一个和最后一个外显子中只能获得小部分circRNA,表明circRNA的生物发生与剪接过程有关。
为了确定circRNA生物发生是否表现出对外显子数量的偏好,比较了circRNA的外显子定位。单个反向剪接外显子体是circRNA的主要类型,大多数circRNA(80%)在三个阶段中都来自一个或两个反向剪接外显子。
为了确定circRNA的形成是否表现出对外显子长度的偏好,分析了外显子长度对circRNA形成的影响。结果显示,通常外显子长度随circRNA来源的外显子数目的增加而增加。
分析circRNA及其亲本基因之间的定位关系。总共个circRNA定位到个亲本基因,大多数亲本基因仅产生一种circRNA。
分析circRNA侧翼内含子的长度,因为它们会影响circRNA的形成。结果表明,circRNA的侧翼内含子显著长于对照内含子,符合先前研究的一般结论。
研究表明反向重复序列可导致RNA环化,作者因此鉴定了侧翼和对照内含子中的重复元件。反向重复元件的存在与circRNA的发生有关,因此应该确定这些反向重复是否参与了相关circRNA的生物发生。
此外,RT-PCR扩增和Sanger测序验证随机选择0具有高表达水平的circRN
图5,对选定circRNA的PCR和Sanger测序验证。
4三个发育阶段的circRNA亲本基因的功能富集分析
鉴于circRNA可能通过调节其亲本基因的表达而发挥功能,作者通过GO和KEGG分析不同发育阶段中circRNA亲本基因的功能。个亲本基因中,个被映射到个GO项,其中个GO术语显示了10个以上的亲本基因。19个亲本基因定位到08个KEGG途径,共发现11条KEGG通路包含超过10个定位到它们的基因。为了确定circRNA是否可以以发育特异性方式发挥作用,作者还在三个发育阶段的每个阶段进行了功能富集分析。菌丝体,原基和子实体分别富集了40、13和4个GO项以及8、17和6条KEGG途径。GO和KEGG富集分析统计表的部分内容展示。
5circRNA在转录调控中的潜在作用
转录因子(TFs)在广泛的生物学过程中起作用,作者还确定了circRNA是否与TF因子相关。将circRNA的个亲本基因的蛋白质序列与FFTD中具有默认参数的蛋白质序列进行了比较,根据FFTD最佳匹配的注释,共有个亲本基因(8.0%)被注释为TF,68个circRNA及其56个亲本基因的表达谱呈正相关,38个circRNA及其亲本基因的表达谱呈负相关。
6外显子circRNA在三个发育阶段的差异表达
为了指示circRNA的阶段特异性作用,作者进行了阶段间差异表达circRNA分析。在三个发育阶段中,共计种外显子circRNA和3种内含子circRNA存在显著差异。个外显子circRNA中总共有、18和8个(85.3%,10.%和4.5%)分别在菌丝体、原基和子实体中表达最高,共有53个亲本基因可能参与转录调控、多糖生物合成等。7circRNA及其亲本基因表达谱的相关性
通过确定circRNA及其亲本基因表达谱之间的相关性,个(16.3%)外显子circRNA及其亲本基因的表达谱呈显著正相关,6个(30.9%)显著负相关。
为了确定在非编码RNA及其亲本基因之间是否存在任何表达相关性,分析了0个circRNA及其亲本基因的表达谱。第一组包括五个属于CAZy家族的亲本基因,三个表达谱与其circRNA的表达谱正相关,两个负相关。第二组包括九对circRNA基因对,对应于属于CYP家族的六个亲本基因,四对显示正相关,五对显示负相关。第三组包括与木质素降解有关的一对正相关的circRNA基因对。第四组包括与MVA途径相关的一个亲本基因,该基因包含两个备选的circRNA,它们均与其亲本基因呈正相关。第五组包括两个正相关的circRNA基因对,亲本基因参与了多糖的生物合成。最后一组包括一个正相关的circRNA基因对,其参与了三萜酸途径。
circRNA及其亲本基因之间的高度相关性和多样的相关性模式表明,circRNA以复杂的方式参与其亲本基因的表达调控。
8灵芝中外显子circRNA的可变环化
考虑到一个亲本基因可以产生一种或多种circRNA,作者最后还确定了由9个不同的亲本基因位点产生的6个选择性反向拼接环化事件。
讨论
本研究首次在灵芝中报道鉴定和表征了circRNA,其表达模式具有组织、时间和/或空间特异性。多个circRNA源自位于同一基因座的外显子,即替代环化,表明灵芝circRNA的生物发生相当复杂。通过识别circRNA表达与其亲本基因的相关性,显示在基因表达调控方面,circRNA与其亲本基因之间存在更多的相互作用。所有这些数据指出,circRNA参与了灵芝中的基因表达调控。关于circRNA的生物发生机理和功能作用的知识,未来需进一步探究。
本篇文章中所提到的circRNA鉴定与表征,差异表达分析,功能富集分析及一系列图表的可视化等,我们均可以提供。
需要做RNAseq的老师,可以咨询我们。与大多数的服务公司不同,在我们公司做RNAseq的老师,可以享受完全免费的个性化分析。主要有两大块,第一是辅助老师撰写RNAseq纯分析文章,快速发表成果。第二是对于追求高层次文章的老师,我们提供RNAseq的大数据分析,结合各类数据库及软件辅助老师,挑选分子,构建机制,包括转录因子、增强子、ceRNA,lncRNA机制,circRNA编码蛋白等多种机制。只要您需要,我们就能分析。
点击左下角阅读原文下载文献原文及译文
长按识别