自然变异可以促进我们对表型多样性和性状进化的理解,最终加快植物育种工作,而在育种过程中,因果变异(优异等位变异,关键因果基因)的挖掘至关重要。迄今为止,编码区变异和启动子变异引起的转录水平多态性已被列为优先研究对象。5′ 非翻译区(5′ UTR)中的上游开放阅读框(uORF)在转录后或翻译水平上调控基因的表达。近年来研究表明,植物自然uORF变异塑造了表型的多样性。
福建农林大学郭子龙课题组受邀在植物学领域国际著名期刊Trends in Plant Science发表了"Natural uORF Variation in Plants"的长篇综述文章。该综述共分为五部分:1.植物中的自然变异;2.uORFs的介绍与它们的调控活动;3.自然的uORFs变异塑造表型多样性的案例;4.uORFs的演化;5.目前的研究方法和未来研究设想。该综述系统总结了植物uORF及其自然变异的研究现状,并详细展望了未来的发展方向。
Introduction to uORFs and their regulatory activity
uORF (upstream open reading frame, 上游开放阅读框)是存在于5’UTR一段短的开放阅读框,其广泛分布于植物基因组上(植物中18~57%的基因含有uORF)。uORF主要是通过抑制下游基因的翻译或引起mRNA降解(NMD, nonsense-mediated mRNA decay)从而降低基因的表达;部分研究表明,uORF也可以通过其编码的小肽行使生物学功能。此外,uORF可以影响下游多个重叠的开放阅读框的选择性翻译(图1)。
图1. uORF的调控活动(A)根据uORF 终止密码子与mORF 之间的位置关系、uORF可分为三种类型:(i) 非重叠的uORF;(ii) 框外重叠的uORF,它们与mORF部分重叠,并与mORF 在框外(导致错义突变或编码蛋白的结构异常);(iii) 框内重叠的uORF,它们共享mORF 的终止密码子。(B)对于非重叠 uORF(最常见的uORF 类型)主要有三种情况:(i) leaky scanning(遗漏扫描,后面有补充),即uORF 逃避起始前复合物(preinitiation complex,PIC)的扫描,因此mORF 的翻译不受影响;40S小核糖体亚基获得三元复合体(TC,eIF2-GTP-Met-tRNAiMet)形成PIC,eIF2-GDP 被 eIF2B转化为eIF2-GTP;(ii) translation re-initiation(翻译重启),即在uORF 翻译后,mRNA 结合的40S小核糖体亚基重新获得TC,以组装PIC扫描mORF起始密码子,mORF翻译启动但被减弱;(iii) ribosome stalling(核糖体停滞),即核糖体停滞在uORF停止密码子或一个特定motif,而不进行 mORF 翻译。(C)uORF 可以通过由uORF引起的PIC组装延迟,介导内部重叠的小 ORF(smORF)而不是mORF的翻译,产生具有独特功能的smORF 蛋白。(D)括号中的 、-、? 分别表示uORF特征与uORF调控强度之间的正相关、负相关和不确定相关。有利的Kozak context, 稀有的三重密码子和强烈的终止密码子对uORF的抑制活性至关重要。uORF起始密码子周围的RNA结构稳定性较差,带更多负电荷的uORF编码肽(机制未知),以及uORF与mORF之间较短的距离增强了uORF的活性;一个较不稳定的RNA二级结构有利于uORF的翻译起始;uORF与mORF之间较短的距离可能导致mRNA结合的40S小核糖体亚单位重新获得TC进行PIC组装和抑制mORF翻译的时间减少。对于5′ Cap与uORF 起始密码子之间的距离、uORF 长度和uORF数量,在不同条件下或不同研究中出现了不一致的结果。
遗漏扫描:核糖体准确地识别起始密码子并起始翻译是决定生物体内蛋白质稳态的重要机制。前人研究发现真核生物翻译前起始复合物(Preinitiation complex,PIC,包含核糖体小亚基和多种起始因子)通常从最靠近mRNA的5′帽的AUG起始翻译。如果在报告基因起始密码子AUG(annotated AUG,aAUG)的上游插入另一个AUG(upstream AUG,uAUG),则会降低aAUG处的翻译起始。如果一个AUG没被PIC识别(被称为“遗漏”扫描,leaky scanning),核糖体则从其下游(靠近3′端)的一个AUG起始翻译,以此类推。根据这些现象,科学家提出了著名的“第一AUG法则”。目前研究人员普遍认为PIC严格地从5′到3′单向扫描起始密码子,即“严格单向扫描模型”。然而,近年来也有研究人员提出“布朗棘轮双向扫描模型”理论,认为PIC沿mRNA运动的过程中同时存在5′–3′和3′–5′方向的运动。这两种模型的主要区别是PIC是否存在3′–5′方向的运动。中国科学院遗传与发育生物学研究所研究员钱文峰团队在Genome Biology上发表了发表了题为Distance-dependent inhibition of translation initiation by downstream out-of-frame AUGs is consistent with a Brownian ratchet process of ribosome scanning的研究论文。该研究发现不对框的下游AUG(downstream AUG,dAUG)可以抑制aAUG的翻译,但抑制作用随着aAUG和dAUG之间距离的增加而减弱。这一现象挑战了“第一AUG法则”和“严格单向扫描模型”,提示PIC在扫描mRNA寻找AUG密码子的过程中,虽然整体上按照5′–3′方向移动,但在局部上是通过一系列小振幅(几个碱基到十几个碱基)的5′–3′和3′–5′振荡扫描实现的。(有趣,有趣!科学,打破边界,真理一直在探索)
除了具有翻译抑制活性,近年研究发现了一些可以促进基因翻译的enhancer uORF,但是具体机制尚不清楚,该综述列出了四种可能的工作机制(图2)
图2.增强子uORFs可能的调控机制(A)uORF的翻译可以解开5′UTR中的RNA结构,从而促进起始前复合体 (PIC) 接近 mORF 的起始密码子。(B)uORF翻译可以调节mORF 沿线的核糖体密度,以避免核糖体碰撞和翻译停滞降解(No-Go decay)(这是一种通过停滞的核糖体堆降解mRNA的机制)。(C)uORF的翻译可能会吸引翻译机制到mRNA上,进而增强mORF的翻译。(D)对于含有多个uORF的mRNA,尤其是在胁迫条件下,第一个uORF 起着绝缘体的作用,如 GCN4-uORF1,由于下游uORF 在胁迫条件下的再启动其效率较低,会促进40S小核糖体亚基绕过下游更具抑制性的uORF,从而增强mORF的翻译。这一机制或许可以解释植物中半数以上的ORF外重叠uORF伴随着非重叠uORF的现象。
uORF的调控活性既取决于自身的序列特征,也受到生长发育时期、细胞组织等环境的影响;该综述系统总结了影响uORF活性的序列特征(图1)和uORF响应环境变化的工作机制(图3)。
图3. uORF响应环境变化的工作机制
Examples of natural uORF variation shaping phenotypic diversity
尽管uORF在调控植物代谢和生物/非生物胁迫以及农艺性状方面发挥着重要的作用,但是其自然变异及其对表型变异的贡献还鲜有报道。Reis et al. (2020)发现PHO1上游存在一个uORF可以在翻译水平上对其表达进行调控。拟南芥和玉米中uORF比较短,而且与编码区有所重复,这通常会抑制编码区的翻译。前人的研究显示PHO1与核糖体的相互作用较弱,说明PHO1的翻译效率可能比较低,这极有可能是uORF所导致(Reis et al., 2020)。近年来,人们开始关注到植物中存在uORF自然变异,这些uORF的自然变异是怎样影响植物的表型变化,从而调控植物的一系列生物学过程?目前,一些经典的uORF遗传学工作为植物uORF自然变异导致表型变异这一假设提供了充分的证据。在这篇综述中作者也详细总结阐述了植物uORF自然变异的6个经典案例,这些案例涉及拟南芥、大豆、玉米、大麦、猴面花5个物种,涉及营养吸收、种子大小、花色3类性状。
图4. 植物uORF自然变异及其对表型变异的贡献
uORF的自然变异—参与的生物学过程
Modulation of Shoot Phosphate Level and Growth byPHOSPHATE1Upstream Open Reading Frame
磷素属于植物生长发育中的必需大量元素。PHOSPHATE1 (PHO1)负责向木质部中运输磷素,其功能丧失型突变体会严重抑制植物生长。PHO1主要在转录后水平上通过泛素化被调控,或者是通过天然反义RNA被调控。small upstream open reading frames (uORFs)在基因翻译水平上的调控发挥重要作用。拟南芥中发现超过三分之一的基因存在uORFs对基因表达的调控作用。uORFs可以提升或者抑制编码区的翻译,这与uORFs与编码区距离、数量等有关。Reis et al. (2020)发现PHO1上游存在一个uORF可以在翻译水平上对其表达进行调控。拟南芥和玉米中uORF比较短,而且与编码区有所重复,这通常会抑制编码区的翻译。前人的研究显示PHO1与核糖体的相互作用较弱,说明PHO1的翻译效率可能比较低,这极有可能是uORF造成的。作者对该基因上游的uORF进行了突变(∆uORF),利用protoplast luciferase assays发现其翻译效率可以增强20倍。
此外,作者发现对 uORF进行突变可以增强转录本与多核糖体之间的相互作用,说明翻译效率被提高了,而转录本的表达水平不受影响。免疫沉淀分析显示uORF的突变可以显著提高PHO1蛋白在磷素匮乏以及正常条件下的表达水平。作者进一步将wild-type uORF的PHO1和∆uORF 的PHO1转化到pho1 mutants中,发现在正常条件下两个类型的PHO1均可以恢复pho1 mutants的表型,但是在磷素匮乏条件下∆uORF 的PHO1的生长显著优于wild-type uORF的PHO1。
Fig .3. Deletion of PHO1 uORFimproves response to Pi deprivation. A,Shoot Pi content of plants cultivated insoil (n 5 6 biological replicates; *P ,0.05, Student’s t test). B, Shoot freshweight (n 5 5 biological replicates;*P , 0.05, Student’s t test; ns, not significant) of plants grown in clay withlow or high Pi. C, Representative pictures of plants from the indicated linesgrown as described in B. D, Shoot Picontent (n 5 5 biological replicates;*P , 0.05, Student’s t test) of plantsgrown as described in B. For A, B, and D,each gray dot corresponds to a biologicalreplicate for either Col-0, pho1-2, twoindependent transformants of pho1-2expressing PHO1 with a wild-type (WT;lines 5 and 8) and mutated (ΔuORF; lines3 and 7) uORF.
A novel polymorphism in the 5‘UTR of HvDEP1 isassociated with grain length and 1000-grain weightin barley (Hordeum vulgare)
同样在2020年,控制粒长的大麦数量性状位点(QTL)中发现了候选基因HvDEP1(编码异源三聚体g蛋白复合物的γ-亚基)及其uORF(非重叠uORF)。其HvDEP1 uORF中一个9 bp的插入/缺失变异(INDEL)导致粒长的变化(图4B)。尽管这种发现尚未得到证实,但也给遗传学家提供了一些暗示,自然的uORF变异可能是QTL的基础。
Fig. 1. Gene model of identified mutations within the HvDEP1 promoter region and the corresponding difference in cis-regulatory elements betweencvv. Vlamingh and Buloke. (a) HvDEP1 gene model with 50 UTR region (red), associated uORF (black) and exons (grey). (b) Mutations locatedwithin 1.6-kb promoter region identified between aligned sequences of Vlamingh and Buloke; cis-regulatory elements impacted by a polymorphism(blue). (c) Polymorphisms present and type. (d) Cis-regulatory elements that contrast between the two varieties.
Variation in upstream open reading frames contributes to allelic diversity in maize protein abundance
该研究以作物玉米为例,发现并证实了5 UTR中短开放阅读框uORF的稀有变异,可以影响主序列mORF蛋白的丰度,从而影响植物的代谢和表型。【点击链接】
Fig. 1.Individuals with rare alleles have altered protein abundance. (A) In each genic region shown in B (generic gene), individuals with at least one rare allele(MAF < 0.02) were compared to individuals with no rare alleles in any of the genic regions. The two-sided Kolmogorov–Smirnov and Mann–Whitney tests testfor differences in the distribution of protein abundance between individuals with and without rare alleles; the one-sided F test for equality of variance tests forgreater variability among individuals with rare alleles. Rare alleles in the 5UTR are significantly associated with dysregulated protein abundance by all threetests. Number of observations without rare allele = 184,668. (C) Distribution of protein abundance (log2 ratio against B73) for individuals with rare alleles in the5UTR (blue), compared to individuals without rare alleles (light blue).
A natural uORF variant confers phosphorus acquisition diversity in soybean
福建农林大学廖红/陈志长团队在Nature Communications发表了题为“A natural uORF variant confers phosphorus acquisition diversity in soybean”的研究论文,发现并证实位于基因5’UTR开放阅读框(uORF)的一个碱基变异导致了大豆群体磷吸收效率水平的多样性。
该研究利用前期收集的大豆磷效率应用核心种质资源,进行了全基因组重测序,并开展了田间表型鉴定,获取了磷效率相关的表型指标。然后针对植株磷含量进行了全基因组关联分析(GWAS),并没有鉴定到显著的关联信号;考虑到磷含量与植株总根长的相关性,为了提高GWAS的检测力,研究者引入总根长作为协变量再次对磷含量进行GWAS, 结果在20号染色体上出现了一个新的显著关联位点。研究者推断该位点不影响根长,是通过影响根的吸收效率从而影响磷的吸收量。基于此衍生了一个新的磷吸收效率的表型指标,即单位根长的磷吸收量(植株磷含量/总根长),利用该表型进行GWAS,鉴定到一个显著的关联信号,正是上述位于20号染色体的位点,并将其命名为CPU1 (component of phosphorus uptake 1)。
通过对位点内基因的组织表达谱信息调查和序列同源分析,初步确定SEC12-like蛋白的编码基因GmPHF1为CPU1位点的候选基因。为了确定该基因的功能,作者分别构建了大豆RNAi和过表达稳转材料,并进行磷吸收效率表型分析,结果发现,该基因影响根的磷吸收效率而不影响总根长;进一步通过LA-ICP-MS证实了该基因在磷吸收方面的功能。
GmPHF1与其水稻和拟南芥同源基因一致,蛋白定位于细胞内质网。位于细胞内质网的蛋白是怎样影响根从土壤中吸收磷?进而通过毛根转化和稳定转化发现并证实了GmPHF1与根中特异高表达的磷转运蛋白GmPT4之间的遗传关系。进一步通过免疫染色发现GmPHF1帮助GmPT4从根表皮细胞内质网转移至细胞膜;同时研究者发现了GmPT4是以极性的方式定位于细胞膜,从而行使从土壤中吸收磷的功能。
既然GmPHF1在磷吸收方面发挥功能,那功能变异位点在哪里?是表达量的变异还是氨基酸序列的变异?继而开展了GmPHF1候选基因关联分析,发现关联信号集中在启动子和5’UTR。基于这些显著的变异位点将该基因分成了两种主要的单倍型:与磷低效单倍型(H1)相比,高效单倍型(H2)提高根的磷吸收效率达38.64%。进一步分析发现5’UTR内含有一个开放阅读框(uORF),存在的两个显著SNPs (SNP476和SNP413)正好位于该uORF,SNP476导致氨基酸的变化,SNP413引入终止密码子,导致uORF的提前终止(高效单倍型(H2)和低效单倍型(H1)分别对应着120 bp和84 bp的uORF)。两个SNP完全连锁不平衡(r2=1)且是高频变异位点(MAF=0.49)。研究者构建了不同单倍型启动子和5’UTR的重组载体,通过Western试验和免疫染色试验证实了功能变异位点存在于5’UTR,含有较长uORF的H2单倍型对应着较高的GmPHF1蛋白含量。最终引起变异的是5’UTR中哪一个SNP,还是两个SNPs同时发挥作用?SNP影响下游GmPHF1的翻译是否依赖uORF?为了解决这个问题,研究者构建两个SNPs不同基因型的重组载体,结果发现导致uORF长度变化的SNP413才是真正的功能变异位点。当人为突变uORF的起始密码子(ATG→AAA),无论SNP413是哪一种基因型,都无法检测到下游GmPHF1的翻译,说明SNP413是通过uORF来调控下游GmPHF1的翻译。免疫染色结果表明SNP413不仅影响蛋白的翻译量还影响着其空间分布, 这可能与uORF的组织特异性相关。最终研究者通过遗传稳定转化,将GmPHF1的高效等位基因转入到大豆中,大豆的磷吸收效率得到显著提高,直接证实了SNP413在表型上的功能,也显示了其在育种方面的价值。【下期将带来本文的详细解读】
Lost in translation: Molecular basis ofreduced flower coloration in a self-pollinated monkeyflower (Mimulus) species
表型演化通常归因于蛋白功能或基因转录的变化。总体上,能够增强或减弱蛋白翻译的突变,从而影响蛋白丰度,这些突变也可能是表型演化的重要来源。然而,在有关自然界表型变异的研究中,这类突变在很大程度上尚未被探索。通过精细的遗传图谱和功能实验,作者鉴定到了一个花色苷激活因子R2R3-MYB基因的单核苷酸替换,导致了一对近缘猴面花物种之间的花色变异,即蜂鸟授粉的红花猴面花(Mimulus cardinalis)和自花授粉的Mimulus parishii。该原因突变位于5′非翻译区,并产生一个上游ATG起始密码子,导致自花授粉物种中蛋白翻译减弱以及花瓣着色减弱。总之,本文的研究结果揭示了在自然表型变异中,影响蛋白翻译而非蛋白功能或转录水平的突变同样发挥了非常重要作用。
A novel active transposon creates allelic variationthrough altered translation rate to influence proteinabundance
本研究鉴定了玉米和水稻上趋同选择基因ZmSWEET4c的一个有功能且具有剂量效应的亚等位基因。鉴定了一类新的转座子,发现转座子可形成uORF,并通过调控蛋白质翻译效率调控基因表达和表型。本研究为基于转座子驱动的作物改良提供了新的途径,通过对转座子进行编辑,可调控蛋白丰度,创制优良等位基因,实现重要农艺性状的改良。
本研究中,作者在玉米自交系B73后代材料中发现了一个活跃的转座子,将其命名为BTA(B73 active TE hAT)。BTA插入到编码糖转运蛋白的基因ZmSWEET4c第一个外显子中,形成了一个新的具有剂量效应的亚等位基因,并导致玉米籽粒大小改变。BTA插入不影响基因转录、剪切、亚细胞定位等,但是通过产生uORF及其自身的二级结构抑制了ZmSWEET4c的翻译效率,降低了蛋白质丰度。除此之外,BTA插入其它基因中也会产生相似的效应。通过转座子捕捉技术,在BTA活跃的后代材料中鉴定到79个新的插入事件,其中包括BTA和BTA-like转座子。新的插入位点具有典型的常染色质特征,包括低水平的DNA甲基化和高水平的H3K27ac。研究还鉴定到BTA及BTA-like转座子对应的自主转座酶,它具有完整的ORF,能够转录和翻译,编码的蛋白质具有典型的自主转座酶功能结构域。
Figure S8 A model of the regulation of transposon on protein translation and kernel phenotypes. Insertion of BTA causes premature stop and re-initiation of protein translation but with reduced efficiency due to the presence of both uORF and RNA secondary structure formed by the transposon. Reduced protein translation leads to smaller kernels.
通过上述的多项研究表明,uORF在植物生长发育、营养元素吸收和营养品质形成中发挥着重要的作用。自然变异中uORF的变异塑造了表型的多样性,多项研究揭示了uORF中的变异在表型变化中的多样性。但总体而言,目前的研究是远远不够的,未来可以利用泛基因组或超级泛基因组来识别核心和可有可无的uORF,挖掘更多的uORF变异,并比较不同物种或属之间的uORF。此外,我们需要一个能够做到高效、高精度地注释 uORF 变异的预测工具,从而更好的辅助基础研究。近年来,全基因组关联分析(GWAS)将遗传学与表型组学紧密的结合在一起,系统地的揭示了植物中uORF变异对表型多样性和翻译多态性的贡献。在未来,期待能够系统地结合多组学系统的挖掘和解析不同物种中的uORF变异数据,绘制植物中的uORF的百科全书。
图5.植物中uORFs自然变异的未来方向
说明:本文中多个精美的流程图均由Biorender绘制,感兴趣的小伙伴可以看看。https://www.biorender.com
参考链接:
1.https://mp.weixin.qq.com/s/rsedIvunwvO9gJRBOYSKKA
2.https://mp.weixin.qq.com/s/Yf1VhNZ0UUXbk2LtzvAl4g
3.https://mp.weixin.qq.com/s/EuQpHrLVoDGYuIfkj5FVbg
原文链接:https://linkinghub.elsevier.com/retrieve/pii/S1360-1385(23)00236-4
详细内容请各位看官移步至原文。感谢大家的阅读,原创不易,欢迎大家评论、点赞、转发 在看