人工碱基:超越自然界
科学家成功地向细菌DNA引入了两种自然界不曾存在的人工碱基,制造出了半人工的细菌,在其他生物体上取得类似的成功或许也不会太远。
本刊记者 陈彬
另一方面,这种简单性也使得DNA的信息编码能力相对受限。随着人类对生命的理解越来越深入,改造生命的“野心”越来越大,研究人员近年来一直在尝试增强DNA的信息编码能力。通过向DNA中添加入两个新的“字母”,科学家在这一领域取得了重大的突破——他们已经构建出了半人工的生命。
寻找“新密码”
很多人都喜欢玩乐高积木,这种玩具之所以风靡全球,是因为使用有限种类的积木模块,你可以拼接搭建出几乎无数种建筑和场景。和乐高积木类似,所有生物的DNA也是由有限种类的模块“拼接”出来的,只不过这些模块只有4种。通过把这些模块按不同的顺序拼接到一起,一个生物体的所有遗传信息得以写入DNA。毫不夸张地说,DNA是一本记录着生物体有关生长、发育、繁殖等所有信息和指令的“生命之书”(这些生命活动会受环境等因素的影响,但生物体对这些因素作出怎样的反应,一定程度上仍可以看作是由DNA编码的),而写就它的就是上述4种不同的“字母”。
构成DNA的这4种字母,是一类叫脱氧核糖核苷酸的有机小分子。每一种脱氧核糖核苷酸都由脱氧核糖(一种含五个碳原子的糖)、磷酸基团和碱基三部分组成。磷酸基团就像乐高模块上的突起和小孔,可以让各个脱氧核糖核苷酸分子以“手牵手”的方式连接成一条长链。编码有效遗传信息的是脱氧核糖核苷酸上的4种碱基:A(腺嘌呤)、T(胸腺嘧啶)、C(胞嘧啶)、G(鸟嘌呤)。为了简便起见,科学家常常把DNA上含这4种碱基的脱氧核糖核苷酸也简写成A、T、C、G(下文也会这样简写)。
为了保证遗传信息忠实传递给子代,细胞的DNA由两条“互补”的单链构成。两条链上的碱基会发生相互作用,两两配对,形成氢键,从而把两条单链“捆绑”到一起。碱基间的配对遵从一种“互补”原则:A和T配对(也就是“互补”),C则和G配对。在复制DNA的时候,细胞会解开DNA的双链,然后分别以这两条链为模版,按照互补原则,合成新的DNA链,最后形成两条双链DNA。这种“半保留”的复制方式使细胞中的遗传信息得以忠实地代代相传。
尽管一个生物体中含有各种不同的细胞,但每个细胞中的DNA序列却都是完全相同的。各种细胞之所以形态和功能各不相同,是因为它们从这本“生命之书”中读取和使用信息时的“侧重点”各不相同:有的读取的是“消化系统”这一章,有的读取的是“神经系统”这一章……
通过不同的排列组合形式,A、T、C、G可以形成各种序列,为生物体的DNA提供强大的信息编码能力。然而随着科技的进步,人类利用、改造生命的能力和“野心”也变得越来越强、越来越大。由4种“字母”提供的信息编码能力将可能无法满足人类的需要。一个最明显的例子出现在非标准氨基酸(nonstandard amino acids)的应用领域。DNA上的基因是细胞用来编码并合成蛋白质的“蓝图”。这幅“蓝图”以三联体密码的形式,指导细胞合成各式各样的蛋白质。
A、T、C、G的排列组合一共可以产生64种(43)不同的密码,其中61种被细胞用来编码自然界中的20种标准氨基酸(一个密码对应一种氨基酸,但一种氨基酸可以由数个密码编码)。标准氨基酸是大自然中各种生物使用的“主流氨基酸”,绝大多数生物合成的绝大多数蛋白质都只含有这些标准氨基酸。剩下的3种密码,分别是TAA、TAG、TGA(在RNA中这些序列叫做“密码子”,分别是UAA、UAG和UGA,其中的U,也就是尿嘧啶,专门存在于RNA中,对应于DNA中的T),是蛋白质合成的终止信号(所以相应的这3种密码子被称为“终止密码子”)。在所有生物的细胞中——无论是在细菌、大猩猩还是人类中,这些密码所编码的信息都是一样的,比如ATG都编码一种名为甲硫氨酸的氨基酸,而TAG则都是蛋白质合成的终止信号。
通过对基因序列进行改造(比如各种形式的突变),科学家能让细胞合成出具有新特性的蛋白质,并加以利用(比如用作药物) 。有的科学家试图通过加入非标准氨基酸(前述20种标准氨基酸之外的其他氨基酸)来赋予蛋白质新的结构和功能。要把这种方法在细胞中付诸实施,至少要用一种密码来编码这些非标准氨基酸才行。遗憾的是,由A、T、C、G组合成的64种密码都已经承担了各自的编码任务。
要解决缺乏密码的困境,最直接的方法就是向细胞的DNA加入A、T、C、G之外的其他碱基。哪怕只是多出一对非天然碱基(Unnatural Base Pairs,简写为UBP),细胞的密码就会增加到216种(63),可以为编码非标准氨基酸提供大量的密码。
“最佳搭档”
通过生物学手段向DNA中掺入UBP的尝试最早始于1989年。使用含有一个非天然碱基iso-C的DNA单链为模板(模板是通过化学方法合成的),并以另一个非天然碱基iso-G和其他4种天然碱基为“原料”(iso-C和iso-G分别是天然碱基C和G的类似物,可以像后两者一样配对),瑞士科学家史蒂文·A·班纳(Steven A. Benner)和同事成功合成出了与模板互补的另一条DNA单链。
在此后的研究中,科学家又发现了更多可以掺入到DNA中的UBP,但略显遗憾的是,过去15年间的所有进展,都是在离体条件下取得的,也就是说实验并不是在细胞内,而是在模拟细胞内环境的溶液中进行的。
2014年5月,这一领域终于取得了重大的进展。美国斯克里普斯研究所(The Scripps Research Institute)的弗洛伊德·E·罗姆斯伯格(Floyd E. Romesberg)领导的研究组在《自然》(Nature)杂志上发表了他们的研究成果,首次把含有UBP的DNA引入到了细菌(大肠杆菌)中。在提供DNA合成“原料”的条件下,这些DNA能被细胞准确复制,并分配到分裂产生的子代细胞中去。由于这些细菌的DNA含有自然界此前从不存在的物质,所以通过这项研究,科学家相当于构建出了半人工的生命(a semi-synthetic organism)。
此前的研究发现,UBP间的配对方式主要分为两种。一种是通过碱基间形成氢键来实现配对,班纳及其同事使用的iso-C和iso-G间的相互作用就属于这一类。另一种方式则完全不同,是通过碱基间的疏水作用来实现配对。罗姆斯伯格实验室使用的就是这类通过疏水作用配对的碱基。(当然,除了上述两种方式,还有其他相对少见的配对方式,比如与金属离子的配合来形成碱基对,以及完全基于结构/形状互补而形成的碱基对。)
与通过氢键配对的UBP相比,通过疏水作用配对的UBP有很大的优势。罗姆斯伯格实验室的陈庭坚博士是这项研究的参与者之一,他告诉《环球科学》记者:“疏水性能为非天然碱基的配对提供很强的相互作用力,同时还能降低非天然碱基和天然碱基间发生错配的可能性,”从而提高DNA复制的保真度,降低因错配而导致非天然碱基丢失(这种丢失发生在下一轮的DNA复制过程中)的可能性。
要找到符合要求的UBP非常不容易。两种非天然碱基不仅要能够配对,足够稳定,还要能被细胞中负责DNA复制和转录(为了指导蛋白质的合成,细胞从DNA上读取遗传信息,合成出RNA的过程)的各种分子高效地识别和利用。“这就需要把非天然碱基的各种性质优化到和天然碱基相当的水平,”陈庭坚说,“过去15年甚至更长的时间里,我们实验室一直在做这方面的工作”。
2008年,罗姆斯伯格实验室研究了60种非天然碱基的3 600种(602)可能存在的配对,最终发现了一对符合要求的UBP——d5SICS和dMMO2(下文把这种碱基对简写为d5SICS:dMMO2)。如果一条DNA链中含有这两种非天然碱基中的任意一种,那么以这条DNA链为模板,都能成功地在模版的互补链中掺入另一种非天然碱基,使DNA复制得以继续进行。遗憾的是,与天然碱基的掺入效率比起来,这对碱基的掺入效率非常低。好在一年之后,罗姆斯伯格实验室的研究人员就找到了更好的组合。通过把dMMO2的两种衍生物与d5SICS分别配对进行实验,陈庭坚的同事发现非天然碱基对d5SICS:dNaM的掺入效率要高得多,与天然碱基的掺入效率相近。因此,d5SICS:dNaM当仁不让地成为在细胞内进行掺入实验的“搭档”。
半人工生命
要想把UBP掺入细胞的DNA,要解决的第一个问题是如何给细胞提供DNA复制所需的“原料”(合成DNA的“原料”都以dNTP的形式存在,它们比组成DNA的脱氧核糖核苷酸多出两个磷酸基团,“N”代表各种碱基)。对于d5SICS和dNaM来说,“原料”就是d5SICSTP和dNaMTP。一个最简单的方法就是直接在细胞的培养液中加入含d5SICS和dNaM的脱氧核糖核苷(脱氧核糖核苷由脱氧核糖和碱基构成,不含磷酸基团),让细胞自己摄取这些脱氧核糖核苷,再由细胞中负责合成天然dNTP的各种酶,把磷酸基团一个一个添加到脱氧核糖核苷上,从而合成出d5SICSTP和dNaMTP。可惜的是,不管是细胞内原有的酶,还是通过人工引入的来自其他生物的酶,都会引起这样或者那样的问题,无法让细胞自己合成出d5SICSTP和dNaMTP。这条路被堵死了。
如果给细胞提供脱氧核糖核苷行不通,为什么不想办法直接把d5SICSTP和dNaMTP引入细胞呢?从这一思路出发,陈庭坚的同事留意到了一种此前在藻类中发现的蛋白质,这种名为PtNTT2的蛋白质是一种转运蛋白,能够把dNTP转运到细胞内(PtNTT2不仅能够转运dNTP,也能转运合成RNA的“原料”,即rNTP,从而也能为非天然碱基在细胞内的转录做好准备)。在把这个蛋白的基因引入细胞之后,细胞就会合成出PtNTT2,并把它们运输到细胞的细胞膜上。就像一条大河上的摆渡人,PtNTT2能够把细胞外各种形式的dNTP和rNTP,从细胞外转运到细胞内,d5SICSTP和dNaMTP也不例外。
选好碱基对,并找到DNA“原料”的导入方法之后,罗姆斯伯格实验室开始拿活细胞做实验:为细胞提供必要的环境,看它们能否复制出含有UBP的DNA。陈庭坚和同事首先把两种不同的环状DNA(科学家把它们称作质粒)引入大肠杆菌细胞。这两种质粒的作用各不相同,一种叫“辅助质粒”(pACS,accessory plasimd),作用是引入PtNTT2的基因,使大肠杆菌能够合成出这种转运蛋白;另一种质粒的DNA序列中含有一对UBP,这种“信息质粒”(pINF,the information plasmid)的作用是充当DNA复制的模板。
UBP在信息质粒上的位置也是经过精挑细选才确定下来的,陈庭坚参与的就是这方面的工作。通过选择合适的位点,可以保证UBP只被科学家选定的酶复制,降低新合成出的DNA片段被其他酶切割掉的可能性,从而使UBP能够相对稳定地保留在信息质粒上,以免在多轮复制之后,UBP逐渐被其他碱基替换、“稀释”掉。不过,信息质粒中的UBP并不是d5SICS:dNaM,而是d5SICS的一种类似物和dNaM(这种类似物也能和dNaM配对)。研究人员使用的是d5SICS的类似物而不是d5SICS,是因为只要在细胞中检测到含d5SICS:dNaM的质粒,那么就可以确定,这些质粒是在细胞内复制产生的,而不是人为引入的(在细胞复制质粒DNA的过程中,d5SICS的类似物会被d5SICS替代,因为研究人员只为细胞提供了d5SICS的“原料”)。
向细菌细胞引入上述两种质粒,并让这些细菌生长15小时后,研究人员从细菌中提取出了这两种质粒,并计算了两者的数量比。与15小时前相比,信息质粒与辅助质粒的数量比降低了一半。也许你会觉得这个结果让人大失所望,但实际上,这已经足以说明利用最初的信息质粒,细菌细胞复制出了大量新的信息质粒。在这些细胞中,由于辅助质粒不含UBP,所以这些质粒的复制能够像在普通细胞中一样正常进行。如果细胞没有同时复制大量的信息质粒,那么后者与前者的比例将几乎变为零。通过计算,科学家得出了量化的结果。短短的15小时中,细胞通过复制,把信息质粒的量扩大到了原来的2×107倍。这些复制出的信息质粒还忠实地保留着与模板DNA中相同的UBP:以质粒中天然碱基的数量作为参照,计算结果显示,和模板质粒一样,每一个信息质粒分子中都含有大约一对UBP。
为了检测这些复制出的信息质粒的稳定性,研究人员在不提供新培养液的情况下,让这些细菌细胞总共生长了6天。在细菌培养液中,作为“原料”的d5SICSTP和dNaMTP会由于不稳定逐渐降解。大约一天之后,培养液中可供细菌使用的d5SICSTP和dNaMTP几乎就完全降解掉了。即便如此,细胞内的信息质粒仍然会稳定的存在相当长的时间,直到由于没有d5SICSTP和dNaMTP供应,DNA中的UBP才在与天然碱基发生错配之后,逐渐被天然碱基所取代。这种稳定性为未来更深入的研究提供了保障:只要不断提供新的“原料”,UBP很可能会稳定地保存在DNA上。
这项研究与通常意义的转基因研究有所不同。转基因技术常常是把一个物种的DNA片段转入到另一个物种的DNA中。由于所有物种的DNA都是由A、T、C、G构成的,所以从理论上说,对DNA进行的这类改造其实都可以通过杂交、进化等途径完成(只不过会花相当长的时间)。而罗姆斯伯格实验室的这项研究,第一次把自然中不存在的成分添加到了细胞内的DNA上,更重要的是,细胞能够对这些DNA进行复制,并在细胞分裂时把它们分配给子代细胞。毋庸置疑,这些子代细胞,是一种半人工的生命。
这项研究一经发表立刻在科学界引起了极大的反响。很多大众媒体都报道了这一研究结果,毫不吝惜地使用“开创性”、“革命性”等词汇来描述这项成果。陈庭坚对此表示认同:“从大约40亿年前生命起源算起,这是生物体的遗传物质第一次含有6个‘字母’,无论从科学史还是自然史方面来看,这都是一件大事。”
这项研究不仅仅具有里程碑式的“历史意义”,同时还为很多此前很难甚至无法开展的研究和应用提供了方法。“最容易想到的一个应用就是,通过组合成新的密码子,我们能够把更多种类的非标准氨基酸编码到蛋白质中去,极大地拓宽蛋白质的功能,”陈庭坚介绍说。除此之外,在疫苗的研发、基因与蛋白质的相互作用等领域,这种方法也可能得到应用。
虽然意义重大,但是对人工生命的研究还有很长的路要走,可以说这项成果只是人类在这一领域的“一小步”。以非标准氨基酸的编码为例,细胞要合成出蛋白质,首先需要通过一个叫“转录”的过程,以DNA上的基因作为模板,合成出相应的RNA。这些RNA就像核酸合成系统和蛋白质合成系统的中间人,把DNA上的遗传信息传递给负责蛋白合成的各类分子。利用这些信息,通过一个叫做“翻译”的过程,负责合成蛋白的分子就能根据DNA上的遗传信息合成出蛋白质。
显然,要想把非标准氨基酸添加到蛋白质里,仅仅给细胞提供更多的密码子是不够的,还需要对细胞的蛋白质合成系统进行改造——这,将是人工生命研究的下一段征程。
本文作者 陈彬是《环球科学》特约记者、神经科学博士,主要关注前沿科学领域。
请 登录 发表评论