摘要:杆状病毒是感染鳞翅目、双翅目和膜翅目不同物种的病毒病原体,具有全球分布。由于它们的生物学特性以及由此产生的生物技术应用,杆状病毒科是自然科学中一个重要的研究和操作对象。随着RNA干扰机制的出现,已经描述了那些不编码蛋白质而是产生类似于微RNA(miRNA)的转录本的杆状病毒基因的存在。这些miRNA与病毒和宿主序列中基因表达的调控功能相关。本文全面回顾了miRNA的生物生成、功能和特性,特别关注那些在杆状病毒中鉴定出的miRNA。此外,它深入探讨了杆状病毒miRNA在调控病毒和宿主基因方面的特定作用,并提出了结构和热力学稳定性研究,这些研究有助于检测具有预测效用的共享特征。本综述旨在扩展我们对杆状病毒miRNA组的理解,有助于改进基于杆状病毒的生物杀虫剂的生产、管理害虫中的抗性现象、增强重组蛋白生产系统,并开发多样化和改进的BacMam载体以满足生物医学需求。
1.杆状病毒生物学
杆状病毒科是研究最广泛的病毒家族之一,尽管它不感染人类或对具有重要社会经济利益的动植物造成感染。 相反,它主要感染各种节肢动物幼虫,包括鳞翅目、膜翅目和双翅目,其中许多被认为是农业害虫。这解释了对杆状病毒的相当大的兴趣,因为它们已经被成功地用作生物杀虫剂配方中的主要活性成分,用于控制多种农作物中的昆虫害虫。随着时间的推移,随着我们对杆状病毒的理解的增长,它们的主要生物技术应用已经多样化到其他行业,导致了作为杆状病毒重组蛋白表达载体(Baculovirus Expression Vector Systems,或BEVS)的遗传改良变种的发展。随后,出现了一种新的应用类型,涉及在哺乳动物中有用的工程病毒。尽管这些病毒在脊椎动物中不具有传染性,但它们可以转导哺乳动物细胞并携带感兴趣的重组DNA,促进疫苗和疗法的概念发展(称为BacMam应用,用于哺乳动物中的杆状病毒)。这些属性使其成为腺病毒载体的技术竞争对手,提供类似的好处,但具有更优越的免疫学特性。杆状病毒的核酸是一个大的圆形双链DNA分子,位于一个蛋白质极性核衣壳内。这个家族的名字来源于这种核衣壳的特征形态,它被脂质双层包围。这些结构被称为包涵体衍生病毒(ODVs),嵌入在称为包涵体(OB)的蛋白质副晶态基质中,后者在感染昆虫细胞的细胞核中形成。在已描述的杆状病毒中,已报告了两种主要类型的OBs:具有颗粒形态的颗粒病毒(GVs)和具有多面体形态的核多角体病毒(NPVs)。GVs通常包含一个ODV,而NPVs可以包含多个ODVs。一些NPV分离物甚至有一个脂质包膜中的ODVs含有多个核衣壳。这种形态多样性,加上宿主特异性和其他属性,导致它们被分类为四个属:Alphabaculovirus(感染鳞翅目的NPVs);Betabaculovirus(感染鳞翅目的GVs);Deltabaculovirus(感染双翅目的NPVs);和Gammabaculovirus(感染膜翅目的NPVs)。目前,Baculoviridae是Lefaviridae目中的一个家族,该目还包括Nudiviridae和Hytrosaviridae,在Naldaviricetes类中(包括Nimaviridae)。值得注意的是,还有一种称为芽生病毒(BV)的病毒形态,它在感染过程中产生,至少对于alphabaculoviruses和betabaculoviruses是这样。BVs有助于将感染传播到受影响幼虫的不同组织。BVs是被脂质膜包裹的核衣壳,含有病毒蛋白,与包围ODVs的膜不同。有了这两种类型的病毒,杆状病毒的感染周期通常被分为一个由OBs和ODVs在易感幼虫的中肠细胞中主导的初级过程,以及一个由BVs(如果存在)主导的次级过程,它可以将感染传播到受影响个体的大多数组织。由杆状病毒引起的病理通常是致命的,可能涉及幼虫液化作为一种可能的结果。杆状病毒复杂的感染周期是通过其遗传内容的复杂调控实现的。国际病毒分类委员会(ICTV; https://ictv.global/taxonomy, 最后访问日期为2023年9月20日)提出了基于核心基因之间的遗传距离和其他生物学属性(如病毒形态和宿主影响)的103种杆状病毒。最近的一项研究,考虑了所有可用的杆状病毒基因组数据,仅基于遗传距离标准提出了类似的结果。这项研究探索了序列范围在81,755到178,733碱基对之间,包含89到183个编码蛋白质的基因。杆状病毒拥有自己的转录和复制机制,所有报告的成员至少共享39个同源蛋白基因。有趣的是,尽管杆状病毒基因组中存在大量的蛋白基因内容,但也观察到了非编码RNA基因的存在,包括那些编码微RNA(miRNAs)的基因,甚至转移RNA(tRNAs)。根据报告的研究,有证据表明杆状病毒基因组内存在信息重叠,其中编码蛋白质和非编码RNA分子可能在同一基因座上编码。此外,也可能存在非基因功能,如复制起点。对每个蛋白基因的功能,以及RNA基因的语法和角色的更全面理解,不仅有助于理解宿主与其寄生虫之间的自然相互作用,而且可能对人类应用产生潜在影响,包括使用这些病毒及其自然和工程变体。
2.miRNA生物生成和功能
RNA干扰(RNAi)机制是大约25年前被认识到的细胞过程,并且在生化上已被成功描述,使得农业和医学的生物技术的设计和发展成为可能。这一在真核生物中高度保守的过程依赖于针对RNA分子的RNPs。该机制是由双链RNA(dsRNA,内源性产生或来自入侵核酸)的存在引发的,这触发了具有核酸酶活性或翻译抑制的RNPs的形成,使细胞能够防御病毒攻击并丰富其基因表达的调控机制。考虑到这一最后的活动,RNAi机制可能作为转录后基因沉默(PTGS)进行干预,为细胞提供了根据它们接收到的动态信号调整其功能的选项。这一保守功能是一个由参与dsRNA处理和RNPs形成的蛋白质编码基因编码的复杂系统,将充当效应核酸酶或翻译阻断剂。此外,它还包括RNA基因,如产生miRNA的miR基因,产生引导RNPs到目标分子的指南。在蛋白质编码基因中,值得一提的是那些编码III型RNases Drosha和Dicer、DGCR8(人类DiGeorge综合征关键区域8)或Pasha(非人类中的Drosha伴侣)以及称为Argonauts(AGO)的H型RNases。自本世纪初以来,已经描述并存储了数千种来自不同生物体的miRNAs,并继续对这些生物分子在生物体生理学和病理学中的作用感兴趣(图1)。
图1. 与miRNA相关的科学出版物和miRBase数据库内容。面板(A)描绘了每年关于miRNA的出版物(原创文章)数量,这些出版物来自不同的实体(除了2023年,那里的结果只是部分的)。数据是通过使用PubMed搜索(https://pubmed.ncbi.nlm.nih.gov/;最后访问日期为2023年4月3日)以及考虑的实体的对应组合关键词“microRNA”获得的。面板(B)展示了一个条形图,说明了在miRBase数据库(https://www.mirbase.org/;最后访问日期为2023年4月3日)的不同更新中报告的miRNA数量,这些miRNA来自不同的实体(当这些信息可用时)。这个图是原创的,之前没有发表过。
当RISC复合体通过特定相互作用遇到目标转录本(通常是mRNA)时,它开始“沉默”目标。这可能涉及水解或翻译抑制,导致目标基因产物处于“关闭”状态。为了执行这一行动,需要发生RNA-RNA相互作用(miRNA-mRNA),通常涉及位于目标分子30非翻译区(UTR)的特定序列。这个区域,称为miRNA反应元件(MRE),作为基因表达的调控信号。已经观察到,RISC复合体的构象由RNP和目标RNA之间的特定结合决定,涉及A:U和G:C碱基对相互作用,以及G:U对。具体来说,这种相互作用是由位于miRNA 50端大约6到8个核苷酸的序列促进的,称为核心或种子序列。这允许预测基因组中可能被特定miRNA调节的潜在靶基因。
图2. miRNA介导的沉默机制。该图示描绘了内源性miRNA介导的沉默的经典途径。
1.从细胞基因组(gDNA)或病毒核酸(vDNA)转录生成pri-miRNA(通常由RNA聚合酶II执行)。
2,3. 与Drosha和Pasha蛋白(人类中的DGCR8)结合生成前体miRNA。
4.由Exportin5和RanGTP协助转运到细胞质。
5.与DICER和TRBP结合,连同Argonaut 2(AGO2)的存在,完成miRNA成熟并形成RNA诱导的沉默复合体(RISC)。
6.miRISC与目标转录本结合(通常位于mRNA的3' UTR)。
3.杆状病毒编码的miRNAs
病毒是寄生实体,利用它们入侵的宿主细胞的细胞资源进行复制并在自然界中维持自己。在宿主和寄生虫之间的这种复杂关系中,发生了旨在终止感染过程或削弱宿主防御机制以促进成功入侵的分子对话。RNAi机制在这些真核生物内的相互作用中发挥着重要作用。因此,能够影响病毒过程的细胞miRNA基因的存在,以及调节自身表达级联以对抗宿主的病毒miRNA基因的出现,成为病毒感染中的显著特征。在这种情况下,杆状病毒也不例外。如前所述,它们的基因组包含miR(bac-miR)基因。全面的文献综述确定了13个有实验证据的报告bac-miRs(表1),从现在开始关注它们。其中,家蚕核多角体病毒(BmNPV;Aplphabaculovirus bomori)中有5个,加州多角体病毒(AcMNPV;Alphabaculovirus aucalifornicae)中有5个,粉纹夜蛾多角体病毒(AgMNPV;Alphabaculovirus angemmatalis)中有1个,斜纹夜蛾核多角体病毒(SpltNPV;Alphabaculovirus spliturae)中有2个。值得一提的是,所有这些病毒都属于Alphabaculovirus属。这并不一定意味着bac-miR基因的发生是这个类群所独有的,而是由于工具的可用性更大等因素,如现有的易感于这些病毒的昆虫细胞系,因此更多的研究工作已经指向这里。报告的bac-miRs与蛋白质编码区域重叠,其中一些在所有已知的杆状病毒基因组中有同源物(核心基因),包括bmnpv-miR-3、AcMNPV-miR-1、AcMNPV-miR-3、AcMNPV-miR-5、agmnpv-miR-4和Splt-NPV-miR-11698-3p。其余的bac-miRs(除了bmnpv-miR 4)不仅位于alphabaculovirus编码基因内,还位于其他属的编码基因内。它们位于Baculoviridae进化过程中保守的序列内,这一事实可能表明bac-miRs作为杆状病毒基因被低估了。鉴于此,通过进行生物信息学和实验调查来验证这一假设将是有趣的,以确定在其他杆状病毒物种的同源蛋白基因中报告的bac-miRs同源物的存在。
此外,它们的目标RNA分子不仅包括病毒mRNA,还包括宿主的mRNA,从而有助于控制它们自己的基因表达和寄生生物的基因表达。在某些情况下,它们的靶标的实验证据尚未得到证明。与鉴定bac-miRs的位置类似,报告的目标RNA由在Baculoviridae中高度保守的蛋白质编码基因的转录本组成,包括许多核心基因,如DNA聚合酶、p6.9、p40、p95、vlf-1、lef-8、DNA解旋酶、odv-e25、ac95、ac101、ac66和ac98。这进一步表明这些RNA基因可能在整个家族中的重要性,而不仅仅是在它们被描述的物种中。
此外,负责它们产生的转录机制尚未完全阐明,这阻碍了对已鉴定的前体miRNAs的典型启动子基序和下游聚腺苷酸信号的预测(表2)。对于某些bac-miRs,并假设这项工作中假设的基序所构成的限制,pri-miRNA序列可能相对较长,这与其他生物系统中的观察结果一致。
4.描述的细菌miRNAs的共同特征
与蛋白质编码基因中的开放阅读框类似,它们可以揭示与密码子分布相关的组成偏差,有助于预测它们的存在,miR基因也可以表现出有助于预测的组成偏差。因此,鉴定出的细菌miRNAs可以作为训练数据集,以发现循环发生、茎长和稳定性等共同特征。这些参数可以为改进预测算法提供有价值的见解。关于这一点,本研究首次对所描述的细菌miRNA在长度和GC丰富度方面进行了表征(图3)。
图3. Bac-miR常见序列特征。箱形图显示了使用Biopython 实现的专用脚本生成的杆状病毒前体miRNAs和成熟miRNAs的GC百分比(A)和长度(B)。对于这些分析,考虑了描述13个bac-miRs的出版物中报告的序列。这个图是原创的,之前没有发表过。
这份分析揭示了GC含量在前体miRNA及其成熟形式中存在显著的分散性,尽管接近甚至高于50%的值占主导地位,特别是在成熟变体中。值得注意的是,当计算成熟miRNAs中GC含量百分比与包含它们的基因组中GC含量百分比之间的比率(R=% GC miRNA/% GC genome)时,观察到的值为1.51±0.33,表明这一属性具有独特的偏差。另一方面,长度被证明是更加保守的,前体miRNAs的长度在55到138之间(90.5±16.05),miRNAs的长度在20到23之间(21.6±1.03)。这些值与其他生物系统中报告的值一致,它们可能对定义bac-miRs的预测算法有用。
另一个需要解决的问题是,是否在pri-miRNAs的二级结构中存在共同的模式,它们作为Drosha/Pasha以及DICER的底物分子(图4)。对这些特性的分析可以揭示双链区域的长度是否保守以及它们的稳定性。
图4. 杆状病毒前体miRNAs的二级结构。展示了来自AcMNPV、BmNPV、AgMNPV和SpltNPV的实验性前体miRNAs的二级结构及其相应的最小自由能(MFE)值。成熟miRNA序列以橙色突出显示。RNAStructure服务器(https://rna.urmc.rochester.edu/RNAstructureWeb/Servers/Predict1/Predict1.html;最后访问日期为2023年9月20日),使用299.15开尔文(26°C,可能是杆状病毒感染幼虫的温度)的温度和默认参数,用于生成结构。碱基对概率由碱基的颜色表示。这个图是原创的,之前没有发表过。
另一个有趣的分析涉及预测来自pri-miRNA(前体miRNA分子)的双链RNA的末端,该末端在5'端具有较低的稳定性。这一特性被认为是决定哪条链将作为乘客链,哪条作为导向链(成熟miRNA)在RISC构象中的关键因素。因此,这些端点的理论热力学稳定性值被计算出来(表3)。
获得的结果揭示了六个bac-miRNAs(bmnpv-miR-1、bmnpv-miR-2、AcMNPV-miR-1、AcMNPV-miR-2、AcMNPV-miR-4和SpltNPV-miR-11684-3p)在成熟miRNA对应的5'端表现出不太稳定的ΔG值,无论是在外环还是在初始堆叠中。与此同时,三个miRNAs仅在第一堆叠中显示出不太稳定或同样稳定的ΔG值(BmNPV-miR-415、AcMNPV-miR-3和SpltNPV-miR-11698-3p)。只有四个分子显示出与预期趋势相矛盾的5'端稳定性特征。尽管在进行这些端点热力学稳定性预测时存在挑战(由于对由导向链和乘客链组成的小双链RNA的身份的不确定性),并且尽管并非所有情况都观察到不太稳定的5'端产生了成熟的miRNA,但检测到了这一属性保持的正向趋势。
5.用于miRNA研究的生物信息学工具
在本研究中对alphabaculoviruses中报告的bac-miRs以及其他先前发表的综合性研究的分析提供了有用的见解,以指导未来在杆状病毒基因组中表达miRNA分子的新型非编码基因的预测。为了进一步增强这一领域的研究,值得注意的是,存在许多数据库和软件工具,它们有助于miRNA的表征和目标搜索。因此,其中一些被呈现(表4)。
将先前建立的属性与报告的bac-miRs有效整合,并审慎使用已展示的工具以及定制设计的计算程序以将它们连接成一个强大的流程,有潜力预测先前未记录的bac-miRs。这代表了对这些假定的非编码基因进行后续实验验证的关键初步步骤。它极大地促进了我们对杆状病毒基因表达调控动态的理解,并进一步丰富了我们对寄生生物与其宿主在感染过程中发生的分子相互作用的理解。
6.结论
考虑到汇编的文献和进行的分析,可以得出结论,13个bac-miR基因位于Baculoviridae中进化保守序列的编码蛋白区域内,其中许多在多个属中具有同源物。它们产生初级转录本,生成大约90个核苷酸的前体miRNA(在大约50到150个核苷酸的范围内),表现出至少两种不同的构象模式(在本研究中称为第一组和第二组),导致产生大约20-23个核苷酸长度的miRNA分子。这些miRNA分子的GC含量高于它们的未处理初级转录本和它们所在基因组的GC含量。目标mRNA包括病毒基因,其中大部分在相同属的所有物种中都有同源物,以及参与细胞和代谢过程的细胞基因。将对报告的bac-miRs进行的这些分析与实验证明整合起来,可以作为预测未检测到的bac-miRs的基础。这一步骤可以作为通过转录组和功能证据确认它们的先导。返回搜狐,查看更多
责任编辑: