【3.4.4.1】核糖体图谱分析Ribosome profile(Ribo-seq)

使用核糖体分析方法检测活跃的翻译

RNA-seq的主要用途在于研究样本中的mRNA的种类与数量,但是mRNAs的存在与否并不直接关系到蛋白质的合成。现在有两种方法可以研究转录以外的翻译情况,可以让研究者们更好的理解翻译组(translatome):

  1. 一种是多核糖体表达谱(polysomal profiling),
  2. 一个是核糖体足迹RNA-seq(Ribo-seq)。

核糖体对mRNAs的翻译具有高度的调节作用,蛋白质水平主要由翻译活性决定。多核糖体表达谱与Ribo-seq可以让研究者探索一个转录本占用多少个核糖体以及核糖体在转录本上的分布(FIG. 5)。这种方法可以让研究者推断在特定时间或细胞状态下哪些转录本正在被活跃地翻译。这两种方法都假设mRNA 核糖体的密度与蛋白质合成的水平相关。在不同样本之间进行比较,就能提示治疗条件下,时间推移以及疾病发展过程中,核糖体的动力学特征,上述的这些情况都与翻译的异常调控有关,例如纤维化,朊病毒或癌症。

Figure 5-翻译组的关键概念。翻译组方法是从那些与核糖体结合的RNA中生成RNA-seq数据,这种方法假设mRNA上的核糖体的密度与蛋白质的合成水平相关。(a)多核糖体表达谱的方法是通过离心将RNA分子分成多核糖组分,然后通过RNA-seq的方法进行比较。在多核糖体组分中表达较高的RNA被认为是更活跃的转录。(b)核糖体足迹(Ribo-seq)法使用RNase来降解暴露的RNA,同时保留那些被核糖体保护的未被降解的RNA。通过对这些保护的RNA进行测序,就可以揭示出核糖体的密度与位置。通过修改变标准Ribo-seq方法,定量翻译起始测序(QTI-seq)或翻译复杂表达谱测序(TCP-seq)可以专门富集起始核糖体或其亚基,同时剔除延长的核糖体,因此可以对翻译的动态过程进行更详细的分析。对翻译组RNA-seq数据的过计算 分析可能确定每个mRAN的相对翻译程度,可以研究翻译的起始,延长与终止的动力学过程。

在多核糖体表达谱实验中,使用蔗糖梯度超离心将与多个核糖体(多核糖体组分)结合的mRNA和与单个核糖体结合的mRNA(单核糖体组分)分离开来,前者用于RNA seq文库制备(FIG. 5a)。与单核糖体组分中检测到的mRNA相比,在多核糖体组织中检测到的高丰度mRNAs可以被认为翻译得更频繁。这种方法也可以用于推测单个mRNAs的翻译状态,也可以用于生成高分辨率的核糖体占有信息与密度(尽管它无法确定核糖体的位置)。这类方法的原始方法已经进行了几项改进。例如,使用非线性蔗糖梯度改善了多核糖体收集,使多核糖体在不同浓度蔗糖溶液界面的收集过程更为简单,使用Smart-seq文库构建技术可以让研究者们分析仅10ng级的多核糖体mRNA,使用更高分辨率的蔗糖梯度和深度测序可以检测了转录本异构体的特异性翻译。然而,多核糖体表达谱实验生成的翻译组信息分辨率相对低,这一过程还比较费力,需要特殊的仪器,这就限制了其应用范围。

Ribo-seq是基于RNA足迹的方法,它最初用于酵母研究。这种方法用环己胺(cyclohexamide)来抑制翻译延伸,并诱导核糖体在mRNAs上停滞。用RNase I消化mRNA会留下20-30个核苷酸,这20-30个核苷酸就是受核糖体保护的足迹,这些足迹被处理后用于制备RNA-seq文库(FIG. 5b)。Ribo-seq能生成高分辨率的翻译谱,描绘核糖体丰度和单个转录本的位置。而多核糖体分析中无法提供核糖体的位置信息时,这说明有可能检测到了翻译的暂停,这些检查可以调节蛋白质的表达。当方法修改了缓冲液和对酶进行了优化后,就能更清楚地揭示Ribo-seq数据中3-bp的周期性,以及条形码和UMIs(检测单个分子的事件)。标准的RNA-seq工具可以用于Ribo-seq的计算分析,但最近已经出现了特定的工具用于寻找开放阅读框,用于差异或异构体水平的翻译分析,以及用于研究密码子偏倚。Ribo-seq的主要限制就是超速离心,以及由于核酸酶不同批次间的变化,以需要经验来确定RNase I的消化条件。

这些方法检测的是来自翻译起始、延伸和终止的信号的平均强度,但是对Ribo-seq的修改可使得其能够研究翻译动力学。定量翻译起始测序(Quantitative translation initiation sequencing, QTI-seq)通过化学“冷冻”和富集起始核糖体,同时从结合的mRNA中去除延长的核糖体来定位转录起始位点。翻译复杂谱测序(Translation complex profile sequencing, TCP-seq)也通过在组装成熟核糖体之前富集与40S核糖体小亚基结合的RNA来检测起始位点。然而,由于这种方法中保留了核糖体的完整性,也可以分析和比较80S核糖体组分,从而更全面检测翻译动力学(FIG. 5b)。

所有的翻译组方法在概念上都是相似的;它们假设mRNA核糖体的密度与蛋白质的合成水平相关。虽然它们的样本制备方案不同,但都需要大量的起始细胞数。最终,翻译组与RNA-seq结合起来研究基因的表达水平,并与蛋白质组学一道来研究蛋白水平,这可能就需要对mRNA的翻译进行一个广泛地理解


在细胞内存在着成千上万种不同的蛋白质,几乎所有生命活动的执行都离不开它。蛋白质是从mRNA翻译而来。然而,转录组数据和蛋白质组数据的相关性却很低,原因在于从转录组到蛋白质组要经历一个复杂且精细的调控阶段——翻译调控(Translation Regulation)[1]。对翻译调控的研究即为翻译组学,包括但不限于核糖体、正在翻译的mRNA(translating mRNA)、tRNA、调控性RNA(如miRNA、 lncRNA等)、新生肽链(nascent polypeptide chain)、各种翻译因子等。翻译组测序Ribosome Profiling(或称Ribo-seq)是针对与核糖体结合,长度约为30nt,正在翻译的mRNA片段进行富集、测序和定量(图1)[2-4]。据此获取每种转录本上核糖体的分布,并可推测起始密码子位置(包括非ATG起始)以及uORFs,并可进一步分析翻译效率,解析翻译调控机制。

核糖体图谱分析(Ribosome profiling),是翻译调控主要技术手段之一。这一方法促进发现在多样化和复杂的生物过程中的基因表达的调控,是蛋白质合成机制、甚至是新蛋白质的重要方面,为编码区域的实验注释提供了一个系统化的方法。

本文主要讨论核糖体图谱的方法原理,其优势和局限性,以及核糖体图谱分析这一方法作为指导生物发现关键因素的一些例子,包括在识别成千上万个新翻译的sORF和翻译替代产物中的突出作用。

一、研究方法

核糖体图谱分析是通过RNA酶处理细胞裂解物,把不受核糖体保护的RNA降解掉,然后应用蔗糖离心的方法,分离被核糖体保护的mRNA片段。通过这一实验处理可得到30个核苷酸左右的"Footprints",可将其直接map到原始的mRNA,用于确定翻译中的核糖体的准确位置。

核糖体足迹(Ribosome footprints)用于构建链特异性文库并进行高通量测序,再将这些测序片段map到合适的基因组上。通过对蛋白合成的比率和mRNA的丰度比较,可使得检测每个mRNA的翻译效率成为可能。

图1 Ribosome profiling与mRNA-seq研究步骤对比

二、核糖体图谱分析的优势

(1) 可准确定量

核糖体图谱分析可对不受干扰细胞的翻译过程的检测和定量提供一个较大的动态范围。这一方法的灵敏度,取决于样本的测序深度,即使一些罕见的翻译事件也可促进相对定量。

(2) 可精确定位

除了具有较大的动态检测范围之外,核糖体图谱分析可提供精确的位置信息。核糖体图谱位置分析可用在翻译调查方面,到目前为止可用来鉴定许多新的核糖体移码突变,终止密码子通读,核糖体暂停,在非AUG密码子和uORF翻译区的翻译起始。

(3) 瞬时测量

当细胞蛋白质发生表达时,核糖体图谱分析就可灵敏检测到。核糖体图谱分析和mRNA-seq的定量反应了转录本的丰度与瞬时蛋白合成的速率不是正相关的。对转录本丰度和蛋白合成丰度的定量检测,可推断相对的翻译效率。翻译效率同时也会随着mRNA实时发生变化,反应了在翻译水平上的一个动力学调控。

三、核糖体图谱分析的局限性

(1) 实验上的局限性

核糖体图谱分析的主要技术挑战是需要在一个特定的生理学状态下,快速抑制翻译来捕捉核糖体快照。

(2) 需要推断蛋白合成速度

这一方法准确的前提是所有的核糖体都已经完成了翻译,通常细胞中不同mRNA的翻译延伸速率是相似的。

(3) 污染的footprint-sized片段

污染的RNA片段(包括non-codingRNAs或核糖体蛋白复合物)在核糖体的蔗糖梯度中迁移,因此可能会在核糖体图谱分析的文库中存在,并且导致翻译中错的读取。

(4)不明确的mappingreads

在基因组测序或mRNA-seq中,较长的reads可以帮助更好地进行mapping到正确的位置,核糖体图谱分析中产生的约30bp的核苷酸的短序列不容易mapping。

(5) 材料的数量

与mRNA-seq相比,核糖体图谱分析的主要限制是需要相对大量的样品。与mRNA-seq相反,核糖体图谱分析目前对单细胞不适用。

四、小结

核糖体图谱分析可对细胞内的翻译进行精确的定量,可提供测量每个蛋白质合成的多少,翻译是如何调控,以及翻译合成的启动和终止位置。核糖体图谱分析的丰度和定量分析数据提供前所未有的机会去探索和模拟复杂的细胞过程。

基于核糖体图谱分析提供的在基因组上的精确位置信息,可在实验上确定基因组的蛋白编码能力。因此可对大量的非标准的翻译事件进行鉴定,包括翻译中新的sORFs,以前已注释蛋白的不同形式,从而挑战传统的蛋白编码区域和基因多样性的观点。信息分析的进步可加速对其他非标准翻译事件的鉴定,比如移码转换,和终止密码子通读将会延伸我们对复杂的基因组的编码蛋白质的能力的理解。核糖体图谱分析也将推进其在复杂系统中的应用,包括核糖体亚基的分析,与特定因素相关联的分析、蛋白质修饰,或是特定类型的细胞或亚细胞位置的分析。

参考资料

药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn