【5.2.1.4】重组生物治疗药物生产中的密码子优化的潜在风险和注意事项

生物疗法正日益成为治疗各种人类疾病(尤其是肿瘤学和血液学)的主要手段。在过去的十年中,治疗性抗体,细胞因子和融合蛋白的生产显着加快了这些领域的发展,并且可能是改善患者预后的主要因素。如今,大多数蛋白质治疗剂在哺乳动物细胞系中均表达为重组蛋白。通常用于增加蛋白质水平的表达技术涉及密码子优化。这种方法之所以可行,是因为遗传密码的简并性使得大多数氨基酸可以由一个以上的同义密码子编码,并且因为密码子使用可能对蛋白质表达水平产生显着影响。实际上,据报道,密码子优化可使蛋白质表达增加> 1000倍。密码子优化的主要策略是通过克服与密码子使用和转移RNA(tRNA)丰度的物种特异性差异相关的限制来提高翻译延伸率。但是,在哺乳动物细胞中,密码子优化的基础假设似乎缺乏依据或没有根据。而且,由于并非所有同义的密码子突变都是中性的,因此密码子优化可导致蛋白质构象和功能的改变。这篇评论讨论了哺乳动物细胞中治疗性蛋白生产的密码子优化。

一、前言

各种蛋白质,包括激素,单克隆抗体,酶和血液因子,作为药物具有很大的用途。在某些情况下,有可能使用从天然来源纯化的材料进行蛋白质替代疗法。例如,糖尿病已使用从牛和猪中纯化的肽激素胰岛素进行了治疗[1]。同样,血友病A已用从人血浆中纯化的凝血因子VIII进行过治疗[2]。然而,使用从动物或人来源纯化的蛋白质的主要限制是许多具有治疗潜力的蛋白质以如此低的水平表达,以至于不能纯化它们。在这些情况下,当重组蛋白以工业规模在基因工程细胞中过表达时,蛋白质治疗将变得可行[3]。尽管已证明包括细菌,酵母,昆虫和哺乳动物在内的多种细胞类型可用于重组蛋白表达,但大多数批准的蛋白质药物均在哺乳动物细胞系中产生,最常用的细胞系来源于中国仓鼠卵巢(CHO) )[4,5]。这些细胞具有适合生产治疗性蛋白质的众多功能,包括:

  1. 在悬浮液中生长,在化学成分明确的无血清培养基中生长以及能够大规模培养(> 10,000 L)的能力[6]。 。
  2. 另外,CHO细胞提供类似于人细胞的翻译后过程,包括共翻译折叠,伴侣结合和糖基化。
  3. 而且,CHO和其他哺乳动物细胞系不太可能产生不希望的翻译后修饰,其可能导致蛋白质被患者识别为异源。

1.1 重组蛋白表达概述 Overview of Recombinant Protein Expression

通常,在哺乳动物细胞中重组蛋白表达的过程包括将合适的互补DNA(cDNA)序列克隆到表达载体(例如DNA质粒)中,然后将构建体引入宿主细胞系,这可以通过不同的方法来实现。方法包括转染,核转染,使用病毒载体以及其他方法[7,8,9,10]。转录进入转染细胞核的质粒,并翻译编码目标蛋白的信使RNA(mRNA)。这种瞬时基因表达的过程用于生成重组蛋白数天,并且可以产生毫克至克数量的重组蛋白,这对于学术研究和临床前工作很有用。但是,瞬时表达不能有效产生大量蛋白质,这是临床研究和商业化所需的。

在过去的一个世纪中,由于细胞培养的巨大进步,包括抗生素的开发,无菌技术和化学成分确定的培养基的发展,表达重组蛋白的能力成为可能。[11,12,13,14]。通过产生稳定的转染细胞系来促进大规模生产,这涉及将表达构建体整合到宿主细胞系的染色体DNA中。整合可以发生在随机的染色体位点或以定点的方式发生,其靶向一个或多个可能已经因其促进高水平表达和稳定性的能力而预先选择的染色体位置[15,16,17,18,19]。为了产生稳定的转染池和克隆细胞系,表达构建体上的标记基因通常用于筛选或选择细胞[20,21]。例如,增强的绿色荧光蛋白基因可以用作筛选标记,以鉴定表达该蛋白的细胞,并通过使用荧光激活细胞分选(FACS)将它们与非表达细胞分离。也可以通过使用选择标记基因和杀死不表达该基因的细胞的方法来生成稳定的转染细胞。可选择的标记包括抗生素抗性基因,新霉素抗性基因,二氢叶酸还原酶(DHFR)基因和谷氨酰胺合成酶(GS)基因。这个过程可以用GS标记基因来说明:用含有GS基因的表达构建体转染细胞;转染后,在能够稳定转染表达GS的细胞生长但杀死不表达该蛋白的细胞的条件下培养细胞。选择涉及在不存在谷氨酰胺的情况下生长细胞,并在存在蛋氨酸亚砜亚胺的情况下抑制内源性GS活性,或者使用缺乏GS活性的营养缺陷型细胞系进行生长。

选择或筛选后,可通过有限稀释或其他克隆方法(包括流式细胞仪或在半固体基质中生长)获得克隆细胞系。在此阶段,单个稳定转染的细胞表达的重组蛋白水平差异极大。表达受到许多变量的影响,包括一个或多个染色体插入位点以及整合质粒的数量。即使鉴定出高表达的克隆,它们的表达水平仍然会受到各种因素的影响,包括插入位点的遗传不稳定性和甲基化诱导的转录沉默[22]。克隆细胞系中也可能发生相当大的异质性[23]。此外,内源基因有时会由于表达构建体的插入而被破坏,这可能会产生意想不到的影响。由于这些原因,对由随机整合产生的细胞系的筛选比针对靶向整合的筛选要广泛得多,并且可能涉及测试数千个细胞系。对于分泌的蛋白质,一种鉴定高表达克隆的特别有效的方法包括在甲基纤维素半固体基质中培养细胞,该基质包含识别重组蛋白的荧光标记抗体[24,25]。单细胞在基质中形成菌落,并且在菌落周围形成荧光晕。光环的大小和强度与分泌的重组蛋白的量相关。根据晕圈的大小/强度和其他参数(包括菌落的大小和形状以及与其他菌落的邻近度),使用自动选择器(例如ClonePix(Molecular Devices,Sunnyvale,CA,美国))选择高表达菌落群落。

一旦鉴定出具有合适表达,稳定性和生长特性的克隆细胞系,就可以通过调节培养条件来优化表达以获得最大产量(参见Wurm [26])。对于不同的蛋白质,稳定细胞系中产生的蛋白质量可能会有很大差异,但是在基于CHO的分批补料培养中,通常可以达到1–10 g / L的产量[27]。

1.2 重组蛋白作为治疗药物的用途

多年来,许多治疗性蛋白质已被美国食品和药物管理局(FDA)批准[28]。组织纤溶酶原激活物(tPA)是在哺乳动物细胞(CHO)中产生的首个重组蛋白,已被批准用于临床[29]。 tPA说明了使用基因工程细胞过表达目的蛋白的优势,因为该蛋白可以高浓度表达为重组蛋白(50 pg /细胞/天),但只有低浓度的哺乳动物细胞才能自然分泌[30] ]。

FDA在2011年1月1日至2016年8月31日期间对治疗性重组蛋白的最新批准审查中发现了62种蛋白[5]。

  • 大多数是单克隆抗体(占48%),其中包括抗体-药物结合物以及抗体Fab片段。
  • 蛋白质的其他主要类别是凝血因子(19%)和替代酶(11%)。
  • 其余的疗法(22%)是融合蛋白,激素,生长因子和血浆蛋白。

这些批准的蛋白质的主要治疗指征是肿瘤学(26%)和血液学(29%)。其他适应症包括心脏病/血管疾病,皮肤病学,内分泌学,肠胃病,遗传病,免疫学,传染病,肌肉骨骼,肾脏病,眼科,肺/呼吸系统疾病和风湿病。在这些批准的蛋白质中,有50%被指定为孤儿(orphan designation.)。

最近,FDA又批准了27项:2016年9月1日至2017年12月31日在药物评估和研究中心(CDER)批准了24份,2016年9月1日在生物评估和研究中心(CBER)批准了3份和2017年12月12日。这些批准包括五种生物仿制药。与Lagasse等人讨论的先前的批准相比。 [5],新单克隆抗体的批准百分比要高得多(78%对48%),其中包括一种双特异性抗体和两种抗体-药物偶联物。还有两种酶替代品,两种疫苗抗原和一种Fc融合蛋白。另外,批准了重组酶与先前批准的单克隆抗体(mAb)组合。这些蛋白的主要治疗指征是肿瘤学(30%)和风湿病(19%)。其他适应症包括皮肤病学,传染病,血液学,遗传病,免疫学,肌肉骨骼疾病和肺/呼吸系统疾病。

1.3 与重组蛋白相关的表达挑战

如第1.1所述,重组蛋白表达过程涉及许多可能影响表达,蛋白质量和细胞生理的步骤。对于许多重组蛋白,表达水平可以决定商业上的生存能力,并经常成为进一步开发的瓶颈。幸运的是,可以考虑使用许多变量来提高生产率(例如,参见Ayyar等人[31])。

  1. 在某些情况下,可以使用替代启动子来驱动重组mRNA的转录,从而改善蛋白质的表达,因为不同的天然和合成启动子的强度和稳定性都不同[32,33,34]。
  2. 另外,通过使与某些染色体位点有关的负面影响最小化,例如通过在表达质粒上包括一个染色体绝缘子序列,可以实现表达和稳定性的改善[35]。
  3. 重组mRNA水平也可以通过有目的地产生具有多个基因拷贝的细胞系来提高,例如通过使用含有DHFR基因作为选择标记的表达构建体来提高[36]。
  4. 对于这种方法,将DHFR构建体引入DHFR缺陷的CHO细胞中,并通过使用浓度增加的甲氨蝶呤(抑制DHFR活性的药物)来选择稳定的转染细胞。
  5. 具有多个基因拷贝的细胞系也可以通过使用定点整合方法来产生[18]。

可以预期,新整合策略的开发将提供对表达水平的更大控制。

增加重组mRNA的水平一直到一定程度都是有用的,超过此水平则没有明显的进一步好处,甚至没有负面影响[26,37]。但是,应该认识到,高水平的mRNA不一定与高水平的蛋白质相关[38,39]。例如,使用DHFR选择方法选择的细胞可以包含多达数千个表达构建体的基因组拷贝,但是蛋白质水平最多只能增加10到20倍(例如Wurm [26])。与表达构建体的大量基因组拷贝相关的问题包括转基因稳定性降低和其他影响,包括位置影响和内源基因破坏[26、40、41]。另外,高水平的重组mRNA可能通过非特异性作用例如通过滴定转录因子或RNA结合因子来限制蛋白质的产生。确实,我们自己的研究表明,当转录由弱启动子驱动而不是强启动子驱动时,针对翻译效率进行优化的mRNA的蛋白质表达会大大提高(Mauro和Chappell,未发表的观察结果)。另外,与过度表达相关的一些负面影响与重组蛋白的生物学活性或毒性有关,这可能影响细胞生理。

重组基因的其他特征可以被修饰以增加表达水平。例如,通常通过在重组基因中包含一个或多个内含子来增加蛋白质产量[42]。另外,通过修饰5’前导序列或完全取代它,可以增强mRNA与其他mRNA竞争翻译机制的能力及其翻译起始效率[43,44]。一种方法涉及将天然或合成的翻译增强元件插入5’前导序列。或者,可以通过用有效翻译的mRNA(例如β-珠蛋白)的5’前导序列完全替代5’前导序列,或用为核糖体募集和启动而优化的合成序列来增强[43]。 3’非翻译区序列的修饰也可以通过增强核糖体募集和mRNA稳定性来增加表达[45]。

由于基因编码区的特征,某些蛋白质本来就很难表达。 这种情况并不出乎意料,因为某些蛋白质(例如酶和激素)的含量通常非常低,如果含量较高则可能有害,并且在体内的表达很差。 例如,人体中血液中的凝血因子VIII含量较低,而该蛋白水平的升高与血栓形成和中风的风险增加相关[46]。 在培养的细胞中,这种蛋白质众所周知很难表达,而在体内,VIII因子基因已经进化出许多限制其表达的特征[47]。 不幸的是,这些相同的进化特征中的一些可能使得难以在培养细胞中过表达重组蛋白。

二、密码子优化

密码子优化是指通过克服与密码子使用相关的表达限制来最大化蛋白质表达的方法。 它通常用于生物生产以及体内核酸治疗应用[31,48]。 据报道,密码子最优化可以使蛋白质表达增加> 1000倍[49],尽管大多数报道还很少。 有趣的是,同义密码子突变也已用于使表达最优化,以微调双特异性抗体的两个轻链基因之一的表达,从而导致该抗体的表达增加[92]。 下面包括mRNA翻译过程的概述,以为该方法提供适当的背景和context 。

2.1 Messenger RNA翻译

翻译是将mRNA模板解码为多肽序列的过程。此过程包括三个步骤:引发,延伸和终止[50]。

  1. 起始涉及在5’m7G帽结构或内部位点通过mRNA募集小的40S核糖体亚基。
  2. 然后,40S亚基移至起始位点,该位点通常是AUG密码子,可被与该小亚基相关的引发剂蛋氨酸转移RNA(tRNA)识别。
  3. 随后,大的60S核糖体亚基结合形成能够合成肽的核糖体复合物。
  4. 在延长周期中,核糖体促进了mRNA中的密码子与氨酰tRNA中的反密码子之间的碱基配对相互作用,后者是与它们的同源氨基酸共价连接的tRNA分子[51]。图1a显示了组成遗传密码的密码子-氨基酸缔合。在延长周期中,核糖体的肽基转移酶活性介导了氨基酸从tRNA到生长中的多肽链的转移。当翻译核糖体到达终止密码子时,多肽合成停止,这导致核糖体复合物解离并释放新合成的蛋白质。

遗传密码的简并性。a)密码子-氨基酸关系。对于每种氨基酸,均标明了三个字母和一个字母的缩写。编码蛋氨酸的AUG起始密码子以绿色表示。该相同密码子用于指定编码区内的甲硫氨酸残基。三个终止密码子用红色表示;它们不指定氨基酸,但终止翻译。除蛋氨酸和色氨酸外,所有氨基酸均由两个或多个密码子编码。 b)简并性使含有不同同义密码子的mRNA编码相同的多肽。该实施例显示了如何从其一级结构显着不同的mRNAs翻译相同的肽序列。在这个例子中,左和右面板中的mRNA序列编码相同的肽,但不使用任何相同的密码子,并且在核苷酸水平上仅≈43%相同。核苷酸差异在右图中以红色粗体显示。根据人类密码子使用情况[65],用白条加下划线的密码子只能通过相应的(同源)aa-tRNA进行翻译。带红色条带下划线的密码子可以通过同源和摆动的tRNA进行翻译,带蓝色条带下划线的密码子只能通过摆动的tRNA进行翻译,因为这些密码子缺少相应的tRNA基因。在这些插图中,核糖体亚基被示意性地表示为桃色结构;较小的结构代表40S亚基,较大的代表60S亚基。 tRNA结合位点标记为A,P和E。为简单起见,每个核糖体均在P位点显示了一个tRNA分子。 tRNA分子表示为苜蓿叶结构。显示了P位点的tRNA,其肽链由所示的mRNA序列编码。下一个延长周期将涉及通过氨酰基(带电)Thr-tRNA识别A位点的密码子(左图为ACC;右图为ACA)。核糖体的肽基转移酶活性将使肽链从P位点的tRNA转移到A位点的tRNA的苏氨酸。然后,mRNA在3’方向上通过核糖体的单密码子转移将在E位点留下不带电荷的tRNA,在P位点具有增长的肽链的tRNA和空的A位点,可用于下一个氨基酰基tRNA。氨基酰基,aa-tRNA氨基酰基-tRNA,E exit,mRNA信使RNA,P肽基,tRNA转移RNA

2.2 改变密码子用法 Altering Codon Usage

密码子优化策略试图通过改变基因的密码子使用来增加蛋白质表达。改变密码子使用是可能的,因为20个氨基酸由61个密码子编码(图1a)。尽管甲硫氨酸(Met)和色氨酸(Trp)各自由一个密码子编码,但所有其他氨基酸由两个,三个,四个或六个密码子指定。由于遗传密码的这种简并性,具有不同同义密码子组成的mRNA序列有可能编码相同的多肽[52](图1b)。因此,同义密码子提供了很大的灵活性。实际上,对于重组蛋白表达,即使通过逆转氨基酸序列也不知道mRNA序列,也可以合成基因。这种逆向翻译的过程被用来表达第一个重组肽,生长抑素,却不知道其mRNA序列[53]。随着基因序列的获得和分析,很明显,自然界中的同义密码子使用不是随机的。

  • 在不同生物之间,同一生物的不同组织之间,甚至同一基因的不同部分之间,密码子使用的偏倚都不同[54,55]。影响细菌,酵母和果蝇中密码子偏倚的因素包括密码子偏倚与翻译效率之间的相关性[56,57,58,59,60]。
  • 影响密码子偏倚的其他变量包括基因组的背景核苷酸组成,甚至在基因组内也可能发生显着变化[61]。
  • 另外,密码子偏倚可能会受各种tRNA表达水平的影响,这些tRNA在不同组织之间可能会有所不同[62,63,64]。
  • 而且,即使在单个基因中,密码子偏倚也可能受到各种限制因素的影响,包括剪接基序,保守的mRNA二级结构,氨基末端编码序列(密码子梯度)以及影响蛋白质折叠的限制因素[55]。

不同的密码子优化策略使用同义密码子来改变可抑制表达的mRNA编码序列的众多特征,包括推定的剪接供体和受体位点。另外,同义密码子是为方便起见而使用的,例如,以促进基因合成和克隆(在Mauro和Chappell中综述[65])。然而,增强蛋白质表达的主要策略涉及通过消除或最小化稀有密码子的出现来提高合成速率。假设表达不佳是由于密码子使用不当引起的。多年来,密码子优化方法的范围从相对简单的方法(用所有最常用的密码子替换所有密码子)[66,67]到看似更复杂的方法(例如密码子协调,codon harmonization),这些方法试图保持翻译缓慢的区域。被认为对蛋白质折叠很重要[68]。维持缓慢翻译区域的这种方法可能被简化了,因为各种证据表明 蛋白质折叠可能会受到通常被认为介导翻译速度缓慢(增加折叠)的密码子以及被认为介导快速翻译速度的密码子的影响,这对于减少中间体错误折叠的可能性可能很重要[69] 。

我们与我的同事Stephen Chappell一起,曾经讨论并严格分析过用于体内应用的各种密码子优化方法[65]。我们确定了构成各种密码子优化策略基础的三个关键假设:

  1. 稀有密码子是蛋白质生产的限速;
  2. 同义密码子可以互换而不影响蛋白质的结构和功能;
  3. 可以通过用常用密码子代替稀有密码子来增加蛋白质的产量。

文献回顾表明,这些假设支持不力或无法推广。例如,稀有密码子限制蛋白质生产的速率的观点是基于对大肠杆菌和低等真核生物的研究,并且在哺乳动物细胞中几乎没有证据支持这种观点。另外,有大量证据表明,同义密码子变化,甚至单个密码子变化,都可以显着改变信使核糖核蛋白颗粒(mRNAs)的形成,mRNA二级结构,mRNA稳定性,microRNA结合,翻译和蛋白质折叠[70,71,72]。

2.2.1 哺乳动物的密码子使用 Codon Usage in Mammals

哺乳动物中密码子使用不同的原因之一是,同义密码子使用中的大量变化似乎与被称为等位基因的染色体区域的GC含量差异相关[61]。等位线(Isochores )是DNA的大片段,具有均匀的GC组成,并包含编码区和非编码区。对人类基因的不同功能类别的同义密码子使用情况的分析显示,基因之间同义密码子使用情况的≈70%的变异可以由染色体区域的GC含量以及减数分裂重组来解释,这在这些地区。值得注意的是,发现由GC含量的大规模变化引起的同义密码子差异与基因的功能类别无关。该观察结果表明,同一细胞中不同的高表达基因具有不同的同义密码子使用模式。对于许多这些基因,密码子使用与tRNA丰度不匹配[61、63、73]。

在非哺乳动物生物中,各种研究表明,高表达的基因包含更频繁使用的密码子,在许多情况下,这些密码子与相应的tRNA的表达水平相关。最近在大肠杆菌,真菌,酵母和果蝇中的研究表明,与不常用的密码子相比,常用的同义密码子具有更快的延伸率[56,57,58,59,60]。尽管在哺乳动物细胞中尚无可比的证据,但对mRNA和tRNA种群的分析并不支持这一观点。实际上,各种研究已经报道了细胞中总体密码子使用与相应tRNA水平之间的良好对应关系。

在一项研究中,对不同人类细胞类型的分析确定了两个不同的tRNA库,它们在增殖或分化的细胞中差异表达[74]。作者发现,转录组中的密码子使用与相应tRNA的表达相协调,从而使密码子群体与翻译所需的tRNA库之间保持平衡。在一项研究中发现了类似的结果,该研究确定了在八个不同发育阶段小鼠肝脏和脑组织中所有密码子的使用频率以及tRNA表达水平[63]。结果显示,通过发育,来自表达的mRNA的密码子库和反密码子库在两个组织中高度相关。另外,注意到在高表达和低表达的基因之间似乎没有密码子使用的差异。在另一项研究中,分析了人类和小鼠肝癌细胞系(体外)和静态肝细胞(体内)中的tRNA库和密码子使用情况[73]。作者得出的结论是,任何这些细胞类型的tRNA库都能够以相似的效率翻译任何其他细胞类型的mRNA转录组。另外,没有证据支持这样的观点,即在不同细胞类型中高度表达的mRNA已针对翻译效率进行了优化。作者认为,通过GC含量的变化可以最好地解释不同基因集之间密码子使用的任何差异。

在哺乳动物中,缺乏核糖体谱研究也缺乏在稀有密码子处降低延伸速率的证据。核糖体分析是一种使用深度测序来鉴定受细胞核糖体保护的mRNA片段的技术。在一项使用小鼠胚胎干细胞进行的研究中,细胞用harringtonine药物处理,以使起始密码子停止新的起始事件。通过使用核糖体图谱监测径流延长,可以确定这些细胞中翻译的动力学[75]。这项研究报告说,翻译速度在很大程度上与密码子的使用无关,并且没有证据表明在稀有的密码子上核糖体会暂停。尽管作者没有排除具体例子的可能性,但他们没有发现任何证据表明密码子使用对总体延伸率有很大影响。

另一项支持稀有密码子不限制表达的观点的研究来自对人类基因组中蛋白质编码序列的分析[76]。这项研究发现,在编码区的前50个密码子中,优先使用丙氨酸,脯氨酸,丝氨酸和苏氨酸的稀有密码子。在合成的融合蛋白的前50个密码子中具有多个丙氨酸密码子的构建体中,测试了对稀有丙氨酸密码子表达的影响。结果表明,含有稀有丙氨酸密码子的构建体的表达要比含有更频繁使用的丙氨酸密码子的构建体的表达高得多。

2.2.2 摆动解码 Wobble Decoding

可能影响延伸率并在密码子优化后中断的一个重要因素是tRNA相互作用的类型,即密码子是否使用标准(Watson-Crick)或摆动的tRNA碱基配对相互作用。一个密码子通过三个Watson-Crick相互作用与其同源的tRNA配对。相反,密码子可以通过摆动相互作用与非同源tRNA碱基配对,所述摆动相互作用对前两个核苷酸使用标准碱基配对,而对第三核苷酸使用不太严格的配对,例如G:U碱基配对。秀丽隐杆线虫和人类细胞系(HeLa)中的核糖体分析表明,摆动tRNA相互作用所解码的密码子的伸长率比沃森-克里克tRNA相互作用所解码的密码子的伸长率要慢[77]。在人类细胞中,与标准G:C碱基对相比,第三碱基相互作用是摆动的G:U碱基对,在密码子位置的核糖体占有率增加了约65%至300%,这与较低的伸长率一致在这些密码子上。对酵母中核糖体图谱数据的深入分析还表明,通过摆动碱基配对对密码子的识别比通过沃森-克里克碱基配对翻译的密码子要慢[78]。

在酵母中,摆动似乎与另一个发现有关,这是特定的相邻密码子对显着降低了延伸速率,而不受任何二肽作用的影响[79]。在这项研究中,观察到对于17个抑制性密码子对中的16个,一个或两个密码子都是摆动密码子。此外,对于11对中的10对,表明密码子顺序很重要,这表明某些密码子对的翻译较慢不仅是由每个密码子的加和作用引起的。此外,与天然(摆动编码)tRNA相比,过表达与反密码子完全匹配的非天然tRNA可以更有效地抑制抑制作用。在另一项研究中,这些抑制性密码子对显示与更快的mRNA衰变有关[80]。特定双密码子对影响哺乳动物细胞翻译的其他证据来自对22种人类遗传疾病或性状的27个不同基因中的35个同义单核苷酸多态性(sSNPs)的分析,该发现确定了由连续密码子对而非由密码子对决定的破坏。单个密码子偏倚[81]。

摆动解码会带来极大的复杂性,而复杂性会受到密码子优化的干扰。 Mauro和Chappell [65]的图1说明了这种复杂性。 摆动本身会在表达61种可能的氨酰基tRNA的不同子集的生物之间变化,这一事实带来了额外的复杂性。 同义密码子变化会破坏同源和摆动tRNA相互作用的模式,因为某些密码子仅由一个同源tRNA解码,其他密码子由同源和摆动tRNA解码,而其他密码子缺少相应的tRNA基因,仅由非密码子解码。 同源的tRNA。 在图1b中,请注意两个mRNA的同源,同源/摆动和摆动密码子使用方式完全不同。 tRNA摆动只是一个变量,但显示了试图理解和重建mRNA的延长节律的复杂性。

2.2.3 其他注意事项 Additional Considerations

通过在体内保持天然mRNA的延伸节律来维持重组蛋白的天然折叠模式的目标并非微不足道。在生产中的生物反应器中,表达目的蛋白质的天然细胞类型(例如体内的肝窦细胞)与生产细胞系(例如CHO或人类胚胎肾293(HEK293))之间存在许多差异。条件。可能影响延伸的差异包括tRNA浓度,决定翻译条件是竞争性还是非竞争性的其他mRNA的水平,以及转录组的密码子组成。 tRNA浓度部分取决于存在的tRNA基因,基因数量及其表达水平。生产细胞系的另一个潜在考虑因素涉及可能受培养条件影响的密码子使用变化,这可能会同时影响tRNA表达和转录组。此外,通过转录或翻译增强,重组mRNA的过表达本身可能会破坏密码子需求和tRNA丰度的平衡,从而导致某些tRNA变得受限,并无意中改变了特定密码子的延伸率。即使未修饰的天然mRNA编码序列在生产细胞系中的翻译也可能与体内不同。一个重要的问题是这些差异如何影响蛋白质折叠?

与将密码子优化的构建体用于体内应用(包括基因治疗,RNA治疗和DNA / RNA疫苗)相关的另一个重要考虑因素是从编码区的框架外隐秘翻译起始位点进行翻译[65]。许多符合读框的阅读框可通过密码子优化进行更改,并编码可能具有不良特性的新型肽。 Lorenz等人报道了这种类型的隐秘启动的一个例子。 [82]谁密码子优化了乳头瘤病毒E7癌蛋白mRNA以分离E7特异性T细胞受体用于T细胞受体基因治疗。密码子优化的mRNA从与T细胞孵育的转染树突细胞中表达。结果揭示了具有密码子优化但非野生型序列的T细胞应答。该反应被映射到来自+ 3-替代阅读框的隐秘肽。当然,当在生物反应器中表达治疗性蛋白质时,由密码子优化的mRNA表达的新型隐性肽的重要性降低了,因为治疗性蛋白质是经过纯化的。但是,仍然需要考虑,因为新的隐性肽可能具有意想不到的生物学效应,这可能会对细胞的生理学或治疗性蛋白的表达和加工产生负面影响。

此处讨论的各种证据表明,与其他生物相比,哺乳动物中有关密码子使用和延伸率的趋势要弱得多。这些证据包括染色体等速线对GC分布模式和密码子使用的影响,在密码子和tRNA库中观察到的平衡以及与摆动解码相关的影响。但是,这些发现并不排除某些基因或某些条件下可能产生的影响。例如,在HEK293细胞中的一项研究表明,非最佳密码子对于促进氨基酸饥饿期间选择性mRNA的翻译至关重要[83]。

2.3 哺乳动物密码子优化:危害何在? Mammalian Codon Optimization: What’s the Harm?

已知同义密码子突变可能在不同水平上影响蛋白质表达,并且越来越多的证据表明翻译本身受到影响,并可能导致某些蛋白质的构象和加工发生巨大变化。各种评论中的许多例子都证明了这一证据(参见McCarthy等人[81],Gotea等人[84]和Hunt等人[85])。

密码子优化的一个关键问题是,尽管它可以维持蛋白质的氨基酸序列,但它可以破坏mRNA编码序列中编码的其他多个信息层[86,87]。这些重叠的功能元素通常很难识别。但是,其中一些元素可能会局部影响延伸率,改变蛋白质折叠并导致蛋白质构象变化和翻译后修饰。同义词密码子突变的非中性性质已在各种研究中得到利用,这些研究筛选了同义词mRNA变体,以鉴定具有改变功能的编码蛋白的构象变体(例如,Cheong等人[88])。同义密码子的不可互换性也是大规模随机重新编码的基础,大规模随机重新编码已成功用于减弱十几种病毒[89,90,91]。使用同义密码子突变来改变蛋白质功能的方法对于包括工业酶优化在内的特定应用非常有用。然而,同义词密码子突变对蛋白质构象的可能影响在生产治疗性蛋白质时风险更大,因为它们可能导致患者出现问题,包括产生降低药物功效的抗药物抗体以及免疫原性并发症[93,94,95]。

建议破坏影响编码区特定位点延伸率的mRNA二级结构的重叠信息,以解释猫内源性逆转录病毒RD114-TR包膜蛋白的密码子优化后获得的结果[96]。尽管密码子优化可提高蛋白质产量,但存在相关的糖基化缺陷,这些缺陷会干扰包膜蛋白的正确加工,从而导致无活性蛋白的产生。

与CHO或其他细胞系中重组治疗性蛋白的产生相关的因素可导致与天然蛋白的差异,从而触发患者体内抗药物抗体的产生。差异可能包括糖基化,影响重组蛋白完整性的因素以及构象改变。重组促红细胞生成素(EPO)说明了如果抗药物抗体也识别内源性蛋白质时可能发生的问题类型。一些用重组EPO治疗与慢性肾功能衰竭相关的贫血的患者开发了针对EPO的中和抗体[97,98]。这些抗体抑制了重组蛋白和内源蛋白的活性,从而阻止了红细胞的产生并导致患者发展为纯红细胞发育不全。在其中一项研究中,比较了来自不同制造商的重组EPO制剂,发现某些制剂或多或少会导致抗EPO抗体的发展[98]。虽然尚不清楚重组EPO构建体的密码子优化是否导致了此问题,但它说明了如果密码子优化的mRNA产生构象改变的重组蛋白时可能会遇到的问题类型。

同义密码子突变令人担忧,因为许多疾病已与单一同义密码子突变相关。密码子优化的mRNA可以从其天然形式改变多达80%[99];因此,最终结果是将大量同义密码子突变引入了mRNA中。最近的一个例子说明了单个同义密码子突变在哺乳动物细胞中的作用来自对囊性纤维化跨膜电导调节剂(CFTR)基因的分析[64]。这项研究表明,该基因中苏氨酸密码子的同义突变(ACT到ACG)影响CFTR蛋白的构象和功能。对囊性纤维化支气管上皮细胞系中核糖体保护片段的分析表明,ACG密码子的核糖体占有率远高于ACT密码子。实际上,ACG是核糖体占用率最高的密码子之一,这表明突变的密码子是这些细胞中翻译最慢的密码子之一,而天然ACT密码子的翻译速度更快。数据表明,这两个密码子的tRNA水平与这两个密码子的预测相对翻译速度相关,从而证实了这些结果。此外,作者表明,可以通过增加对应于突变ACG密码子的tRNA的水平来挽救CFTR突变蛋白的结构和功能缺陷。这些结果强烈支持CFTR蛋白中单个同义密码子突变会导致结构和功能缺陷的观点,因为突变的密码子翻译较慢。尽管在此示例中稀有密码子的作用似乎与哺乳动物细胞中许多其他研究报道的结果相反,但它提供了密码子使用复杂性的一个例子,因为与突变的ACG密码子对应的tRNA在其他细胞中并不罕见。人体组织,提示在上皮细胞系中观察到的作用是组织特异性的。

密码子优化应被视为可能有助于重组蛋白免疫原性的多种可能因素之一。此外,就可能出现的潜在安全性问题而言,并非所有生物制剂都是等效的。例如,通过靶向其他分子发挥功能的重组单克隆抗体可能比天然蛋白的重组版本具有更高的安全性,如果针对重组蛋白的抗药物抗体识别内源蛋白,则可能会产生重大后果。然而,无论如何,密码子优化的另一个目标,除了增加表达外,还在于提高安全性。

2.4 失去机会了吗? Lost Opportunities?

与密码子优化相关的潜在问题是,当蛋白质从学术和临床前研究转移到临床试验时,它通常用于尝试提高蛋白质产量。然而,很可能使用基于天然mRNA序列的基因构建体进行了许多学术和临床前研究。密码子优化的变体可能表现出不同的行为,并且是在临床前研究中蛋白质产生非常有希望的数据但在GMP条件下放大后未能按预期表现的情况的基础。令人担忧的是,当使用密码子优化版本的蛋白质时,高效蛋白质药物可能会受到负面影响甚至跌落。

例如,对于疫苗开发可能非常有用的分子包括广泛中和的抗体,例如来自罕见HIV感染患者的抗体。这些抗体在患者中的发展可能需要很多年,通常涉及多轮广泛的体细胞突变[100,101]。诸如与密码子优化相关的同义突变产生的细微变化可能会影响这些广泛中和的抗体的结合活性,并阻止它们与它们所基于的抗体相同地起作用,从而降低甚至消除其有效性。提供该实施例是为了说明可能发生的问题的类型,并且不限于广泛地中和来自罕见HIV感染患者的抗体。

我们不知道重组蛋白的密码子优化在多大程度上导致功效降低或免疫原性增加。 但是,在某些情况下,这些蛋白质可能代表失去的机会,可能需要对未经密码子优化的mRNA进行重新研究。 对于在密码子优化后(例如按比例扩大用于临床试验后)表现不如预期的任何蛋白质或抗体而言,尤其如此。

2.5 为什么密码子优化有时会增加表达?

如果密码子优化确实由于增强的密码子使用和更有效的延伸而确实增加了哺乳动物细胞中的蛋白质产量,那么这种作用应该是可靠且可重现的。尽管有证据表明某些密码子优化的mRNA的翻译速率比非优化的mRNA快(Hanson和Coller综述[72]),但表达增加似乎并不是一个普遍发现,许多研究报告几乎没有影响[65,102]。在未发表的研究中,我们订购了mAb的密码子优化轻链和重链基因。从同一家商业供应商处订购了三个轻链基因和三个重链基因。密码子优化的核苷酸序列的比较显示它们都是不同的,即,每个基因使用不同的同义密码子突变。令人惊讶的是,当这些轻链和重链基因的组合(t = 9)在瞬时转染的CHO细胞中表达并比较了mAb的表达水平时,结果表明表达变化> 5倍。不同轻链和重链组合之间mAb表达差异的大小很难与所提出的延长延伸率机制协调,也无法激发对密码子优化基因的预期表达特性的信心。

某些密码子优化的mRNA在哺乳动物细胞中表达的增加似乎不太可能是由于伸长率的提高,而是偶然事件的结果。例如,增加的重组mRNA水平可能导致表达增加,这可以通过多种机制发生,包括miRNA种子序列的破坏,mRNA降解的减少或转录的增加。在酵母中,观察到密码子使用偏倚与mRNA水平呈正相关,这至少部分是由于对mRNA稳定性的影响[103]。此外,最近的一些研究表明,密码子优化的作用发生在转录水平。在Neurospora中,研究表明,从密码子优化的mRNA中获得的mRNA和蛋白质水平的提高不是由于mRNA稳定性或翻译水平的提高,而是转录水平的提高[104]。这项研究表明,某些密码子非最佳的基因在染色质水平上经历了转录沉默。在对两种Toll样受体(TLR)进行分析的哺乳动物细胞研究中,得出了相似的结论[105]。这项研究表明,TLR7的密码子优化使其表达增加了40倍,而紧密相关蛋白(TLR9)的密码子优化则没有效果。核糖体分析研究表明,密码子优化的TLR7的翻译效率仅适度提高,并且对表达的影响主要是由转录增加导致的mRNA水平升高引起的。作者认为,对转录的影响是由密码子优化后GC含量增加引起的。

2.6 建议的密码子优化新目标

在许多情况下,密码子优化可增强蛋白质表达,并且随着算法结合基于密码子使用和与高蛋白质表达相关的模式的经验观察结果,预计这些方法将继续得到改进[106]。如果目的是增加表达,这是可以接受的,并且它适合于某些应用,例如,蛋白质进化和增加工业酶的表达和/或活性。然而,对于天然治疗蛋白在靶细胞中的重组表达,另一个目标应该是维持天然蛋白序列的构象和加工。如前所述,增加蛋白质产量的最佳方法是直接或通过影响该过程的因素来提高翻译起始速率,例如,通过整合翻译增强子元件,增加mRNA水平或使用内含子。由于与同义密码子突变相关的潜在问题,因此建议即使有的话也应谨慎使用,如果有的话,应以科学的理由使用。为了产生治疗性蛋白质,似乎难以证明与密码子优化相关的大量同义突变是合理的。

考虑到密码子最优化可能导致蛋白质构象改变的可能性,建议在患者中使用重组蛋白药物之前评估密码子最优化的结果至关重要[70]。高分辨率方法越来越多地用于比较天然和经密码子优化的mRNA衍生的蛋白质之间的构象差异,可用于鉴定可能有害的蛋白质变异[107]。可以预期,开发用于快速,更容易地探测蛋白质构象的新方法将能够在开发的早期阶段筛选大量蛋白质变体。似乎仍然需要其他研究。

三、总结和结论

大量研究表明,在哺乳动物中优化密码子的科学依据缺乏支持。因此,很难证明使用密码子优化作为治疗性蛋白质生物生产的工具是合理的。因此需要提出的问题是,为什么密码子优化仍然被普遍使用?一个可能的原因是,在某些情况下,临床试验和商业化需要更高水平的蛋白质表达,并且有时可以通过使用密码子优化的mRNA获得这些表达水平,而无需考虑其潜在机制。不幸的是,直到该药物进入后期临床试验或该药物上市后,才可能发现与密码子优化相关的一些潜在问题,这些问题可能影响蛋白质功能并增加免疫原性[99]。

令人惊讶的是,FDA的生物治疗批准尚不需要披露基因序列[5],因为对基因结构的了解(天然或密码子优化)将有助于确定影响药物安全性的特定问题是否与密码子优化相关。从设计考虑,基因序列信息应成为FDA质量的重要组成部分。值得庆幸的是,同义密码子使用的影响以及与密码子优化相关的潜在问题已被FDA的科学家认可并正在积极研究中[5,102]。希望FDA尽快采取措施解决这种情况。应该注意的是,缺乏核酸信息也会显着影响生物仿制药的产生,如果不了解创新药物的基因序列,很难实现相似性。但是,由于生物仿制药正在替代使用较旧技术开发的蛋白质,因此有人提出,如果生物仿制药与参考蛋白质不相同,实际上可能会更好[5]。朝着使用更天然的mRNA序列迈进是朝正确方向迈出的一步。

参考资料

  • BioDrugs volume 32, pages69–81(2018)Cite this article。 Codon Optimization in the Production of Recombinant Biotherapeutics: Potential Risks and Considerations。网址:https://link.springer.com/article/10.1007/s40259-018-0261-x
药企,独角兽,苏州。团队长期招人,感兴趣的都可以发邮件聊聊:tiehan@sina.cn
个人公众号,比较懒,很少更新,可以在上面提问题,如果回复不及时,可发邮件给我: tiehan@sina.cn