“剪辑”基因
科学家如今几乎已经能在生物体基因组上的任何区域,实施精确操作,从而对不同基因的功能,以及各种疾病的发病机理进行研究,甚至开展基因疗法。
本刊记者 陈彬
2014年1月30日,两只可爱的食蟹猕猴——宁宁和明明的照片出现在了各大科学媒体的网站上。对于生命科学界来说,这两只刚出生不久的猴宝宝有着特别的意义:它们是人类第一次通过精确定位的基因编辑技术,实现基因编辑的灵长类动物。
这种精确的基因编辑能够实现,得益于一种新兴的、被称作CRISPR/Cas9系统的DNA编辑技术。利用这种技术,科学家如今几乎已经能在生物体基因组上的任何区域,实施精确操作,比如删除、插入基因以及定点突变等,从而对不同基因的功能,以及各种疾病的发病机理进行研究,甚至能对患有遗传疾病的实验动物进行基因治疗方面的尝试。
此前,在基因编辑研究领域,科学家就像缺少了一把精准剪刀的“裁缝”,尽管有着各种各样极具创意的想法,但在将其付诸实施的时候却又常常略显笨拙。如今,经过20多年的不懈研究,尤其是过去一年间研究成果的井喷式爆发,他们终于找到了那把找寻了很久的“基因剪刀”。
灵长类动物,第一次!
这项食蟹猕猴研究发表在著名的《细胞》(Cell)杂志上,研究的主要参与者是南京大学模式动物研究所的黄行许、南京医科大学的沙家豪和云南省灵长类动物生物医学研究重点实验室的季维智团队的科学家。
整个实验围绕着食蟹猕猴的Nr0b1、Ppar-γ、Rag1这3个基因展开。根据这3个基因的序列,研究人员设计并合成了相应的“引导RNA”(sgRNA)——顾名思义,它们可以引导相关分子,到达上述3个基因的位置。随后,科学家把这些引导RNA和一种来源于产脓链球菌(Streptococcus pyogenes),并经过人工改造的基因Cas9的mRNA(细胞合成蛋白质的“指南”),一起注射到食蟹猕猴的受精卵中。在受精卵中,细胞能够根据Cas9基因的mRNA合成一种蛋白,这是一种能够切割DNA的核酸酶(也称Cas9蛋白)。在引导RNA的帮助下,Cas9蛋白会被引导到相应基因的特定位置上,对DNA实施切割,产生具有双链切口的DNA。
在生物体的细胞中,DNA几乎时时刻刻都会发生各种损伤。为了保证遗传信息能够准确传递给子代细胞,细胞形成了一整套DNA修复机制。当Cas9蛋白切割DNA,产生双链切口后,细胞便会启动上述机制,修复DNA。
但在食蟹猕猴的受精卵中,科学家没有给承担修复功能的蛋白质,提供可供参考的“同源性模板”(homologons template)——也就是说,科学家没有提供一段外源性的DNA序列,以便细胞“依葫芦画瓢”地对断裂的DNA进行修复。因此受精卵只能通过一种名为非同源性末端连接(nonhomologous end joining,NHEJ)的方式,简单地把断裂的DNA连接起来。然而,这样一种修复方式常常会出错,使修复位点附近增加或者缺失少量核苷酸,导致基因发生突变。利用这种容易出错的DNA修复机制,科学家可以对感兴趣的基因进行基因编辑,筛选出那些基因发生了突变的细胞(或者实验动物),然后研究这些突变基因的功能。
在发表于《细胞》杂志的那项研究中,科学家一共对186枚受精卵进行了显微注射,随后将其中的83枚植入到了29只代孕雌猴体内,最后有10只代孕雌猴成功怀孕。在怀孕155天之后,第一只雌猴通过剖腹产,产下了两只雌性猴宝宝——宁宁和明明。通过不止一种方法对两只幼猴多种组织中的DNA进行检测,研究人员证实,他们成功地对两只幼猴的Ppar-γ、Rag1基因实现了编辑。精确的基因编辑技术在灵长类动物中首次取得了成功。
实际上,这并不是人类第一次对灵长类动物进行基因改造了。早在2001年,美国科学家就用病毒为载体,把绿色荧光蛋白的基因转入了猕猴的基因组。这更不是人类第一次在动物身上,成功进行精确的基因编辑,科学家早就可以使用同源重组(在序列比较相似的DNA间,进行DNA交换)等方法,对多种动物实施基因改造了。
但是,中国科学家在食蟹猕猴中开展的研究仍然非常重要,因为这次研究克服了前述两种技术在灵长类动物研究中难以回避的缺陷。一方面,使用病毒作为载体进行转基因操作时,研究人员无法让病毒把DNA精确插入基因组中的某个特定位点,而且也无法限定整合到基因组中的目标基因的拷贝数,这给研究带来了很多不确定性。而使用CRISPR/Cas9系统,依靠引导RNA,科学家便能精确控制基因编辑的位点。
另一方面,虽然依赖于同源重组的基因工程手段,在以小鼠为实验动物的研究领域得到了广泛使用,但这种方法在灵长类动物中却不可行,因为同源重组发生的频率非常低,而灵长类动物生长周期长,无法大规模饲养,产仔数量也少。利用同源重组,让灵长类动物的一个基因发生突变已经非常困难,更别说在一只动物中实现多基因突变了。而利用CRISPR/Cas9系统,科学家却能以极高的效率,在单只动物中实现多基因突变——宁宁和明明就是明证。不难想象,这样一种强大而高效的研究工具,在生物学和医学研究中,尤其是与灵长类动物(包括人在内)相关的研究中,将会有着怎样的应用前景。这样一种新技术,也许很多人想不到,源头竟然在不起眼的微生物上。
细菌的“杀毒指南”
1987年,日本科学家在大肠杆菌的DNA上发现了一类特别的DNA序列。在这种序列中,包含着一些较短的重复DNA片段(也就是说,这些片段在基因组中多次重复出现)。这些重复序列并没有紧挨着串联在一起,相反,它们被一些不同的短DNA片段所隔开。在随后的研究中,科学家在很多的细菌和绝大多数的古细菌中,都发现了这种DNA序列。2002年,科学家把这种序列正式命名为CRISPR(Clustered Regularly Interspaced Short Palindromic Repeats,目前在国内还没有统一的中文译名,如果按英文直译,意思是“成簇分布规则间隔的短回文重复序列”)。CRISPR长度一般为23~47个碱基对。而那些起间隔作用的片段,被科学家称作间隔序列(spacer),长度则一般为21~72个碱基对。
虽然早在上世纪科学家就发现了CRISPR,但关于它们功能的研究却一直进展缓慢。大约10年前,科学家才逐渐揭开了这种神秘序列的面纱:它是细菌(或者古细菌)攻击入侵病毒的“杀毒指南”(侵染细菌的病毒也叫做噬菌体)。要通过CRISPR序列攻击外来的病毒核酸,单单一段重复DNA序列显然是不够的。科学家发现,在向外来核酸发起攻击的过程中,CRISPR附近的一类基因至关重要,他们把这类基因编码的蛋白质称为Cas蛋白(CRISPR-associated proteins),中国科学家在食蟹猕猴研究中使用的Cas9蛋白,就是这个“家族”的一员。Cas蛋白的基因附近的一段DNA也很重要,细菌会以这段DNA为模板,合成一种tracrRNA(trans-activating crRNA)。细菌要通过CRISPR对外源核酸发起攻击,Cas蛋白和tracrRNA缺一不可。
通过进一步研究,科学家发现,细菌(古细菌)CRISPR中的间隔序列实际上是细菌遭遇病毒入侵的“历史档案”。当某种噬菌体的核酸首次侵入细菌时,细菌细胞中的一些蛋白(包括部分Cas蛋白),会对这些外来的核酸进行切割处理,并把外来核酸上的某些短片段插入细菌的CRISPR中——这些短片段就是新添加到细菌CRISPR上的间隔序列。这些间隔序列,就像一个“犯罪数据库”,会把那些有“前科”的病毒的信息记录在案。
当这些有“前科”的病毒再次入侵时,细菌就可以利用这个“数据库”里的信息来搜捕“罪犯”了。以CRISPR序列作为模板,细菌会转录合成出CRISPR的前体RNA(pre-crRNA)。通过tracrRNA和其他一些蛋白质的合作,CRISPR的前体RNA会被进一步切割处理,形成各种带有不同间隔序列的成熟crRNA。这些crRNA就像一张张罪犯的照片,可以帮助细菌找到再次入侵的各种病毒。这些成熟的crRNA会和Cas9、tracrRNA形成一个“核酸—蛋白质”复合物。利用crRNA中的间隔序列,以及噬菌体核酸上独有的PAM序列(protospacer-adjacent motif),这个复合物会找到,并结合到病毒核酸中的特定序列上(正是PAM序列的存在,避免了复合物“敌我不分”,结合到细菌DNA上,因为细菌和病毒的核酸上都有作为“杀毒信号”的间隔序列),然后利用Cas9的核酸酶活性,对噬菌体核酸进行切割,阻止后者复制。
基因编辑的新时代
从细菌精确切割DNA的防病毒机制中,科学家看到了对基因进行高效编辑的潜在方法。2013年2月,两个美国实验室在同一期《科学》(Science)杂志上发表了各自的研究成果,分别报道了使用产脓链球菌CRISPR/Cas9系统,对细胞进行基因编辑的方法。麻省理工学院的张锋博士是其中一个实验室的负责人,当时在他的实验室攻读博士学位的丛乐,是这项研究的主要参与者之一。
细菌是一种原核细胞,这类细胞和真核细胞(比如动物、植物细胞)间有一个重要区别:真核细胞有细胞核,而细菌则没有。真核细胞的DNA分布在细胞核里,因此要想使用细菌的CRISPR/Cas9系统对真核细胞进行基因编辑,就需要解决一个问题——保证CRISPR/Cas9系统的各个组成部分都能顺利进入真核细胞的细胞核。丛乐和同事对来自产脓链球菌的Cas9蛋白进行了改造,在Cas9蛋白上添加了一种核定位信号(NLS,nuclear localization signals)。这种核定位信号就像一把能够打开细胞核大门的钥匙,可以让在细胞质中合成出来的Cas9蛋白进入细胞核,对基因进行编辑。
通过把起引导作用的RNA(以pre-crRNA的形式)、Cas9蛋白和tracrRNA的编码序列一起导入真核细胞中,再利用NHEJ修复机制,丛乐和同事对真核细胞中的基因实现了成功而高效的编辑,得到了缺失或增加了核苷酸的突变基因。除此之外,通过把CRISPR/Cas9系统和一个同源性的修复模板一起引入细胞,丛乐和同事为细胞提供了一个“依样画葫芦”进行修复的模板。利用这个模板,通过细胞的另一种DNA修复机制(同源性指导的修复机制,homology-directed repair,HDR),丛乐和同事成功实现了对细胞基因中特定DNA片段的替换。如果说NHEJ机制导致的插入或者缺失突变还有一些不确定性的话(无法确定是插入还是缺失碱基,也无法确定插入或者缺失碱基的数目),这种HDR机制诱导的DNA片段的替换,则完全是按照科研人员的意愿来进行的。
在丛乐看来,这种新技术有着前所未有的优势,“CRISPR/Cas9系统依赖于RNA来引导Cas9蛋白,进而完成基因编辑,因此在对一个新的基因进行编辑时,无需对蛋白质进行改造,需要改变的只是RNA”,而合成不同序列的核酸非常容易。
CRISPR/Cas9系统并不是科学家发明的第一种能对基因组进行精确编辑的技术。在此之前,科学家已经能利用ZFN(Zinc Finger Nuclease,锌指蛋白核酸内切酶)和TALEN(Transcription Activator-like Effector Nuclease,类转录激活因子效应物核酸内切酶)对基因组进行精确编辑了。但是,这两种方法的效率偏低,因为每次编辑新的基因时,科学家都得对承担“编辑”任务的蛋白质进行改造,以保证这些蛋白质能够识别新基因的DNA序列,进而完成编辑。但这种改造常常费时费力。据丛乐介绍,利用CRISPR/Cas9系统,只需要大约4周就能得到一种单基因突变的小鼠,而用ZFN或者TALEN编辑技术,则至少需要8~12周的时间。不仅如此,“有时,基因组上的某些区域很难用ZFN或者TALEN进行编辑,而使用CRISPR/Cas9系统则能取得成功。在这些情况下,我们只能使用CRISPR/Cas9系统。”使用CRISPR/Cas9系统,同时编辑多个基因也更加容易,这为研究涉及多个基因突变的疾病提供了便利。
上述优点使人类的基因编辑水平进入了全新的时代。去年年底,在盘点过去一年间的重大科技进展时,包括《自然》(nature)在内的多家权威科学媒体都把CRISPR/Cas9系统列入了自己的榜单。“由于成本低而且易于操作,现在几乎全球每一个实验室和生物技术公司,都能够通过基因编辑获得基因敲除和基因敲入的细胞或动物,这在历史上还是第一次,”丛乐告诉《环球科学》。
2.0版的CRISPR/Cas9
尽管CRISPR/Cas9系统有如此多的优点,但这种新兴技术也有自己的软肋:在进行基因编辑的过程中,有时会出现“脱靶”的情况。也就是说,这个系统有时会漏掉目标基因,而对序列相似的其他DNA片段进行编辑。正是这一缺陷,很大程度上限制了CRISPR/Cas9系统在基因治疗等领域的应用。不过,丛乐却对此非常乐观,他认为随着研究的深入,问题会得到解决,“ZFN和TALEN基因编辑技术也经历了一个这样的发展过程,逐步得到了完善。”
实际上,从问世的那一刻起,科学家就一直在对CRISPR/Cas9系统进行完善,以期降低这种技术的“脱靶率”。通过对Cas9蛋白进行改造,丛乐和同事得到了一种Cas9的突变蛋白(Cas9n),这种蛋白不再像Cas9那样,可以切割DNA,产生双链切口,而是只能通过引导RNA,在双链DNA的一条单链上产生一个切口。把Cas9n蛋白和一对引导RNA引入细胞之后,在不影响编辑效率的情况下,丛乐和同事大幅降低了CRISPR/Cas9系统的 “脱靶率”,发生率仅为以前的1/50~1/1500。准确性的提高,为CRISPR/Cas9系统在医学等领域的应用提供了很大的帮助。
除了对基因进行定点突变、删除等形式的编辑之外,科学家现在还能利用CRISPR/Cas9系统对基因的表达水平(基因在细胞中的“活性”)进行调控:通过对Cas9进行改造,科学家创造了一种完全没有核酸酶活性的蛋白(Cas9nuclease-null)。这种蛋白可以扮演“召集人”的角色,在引导RNA的帮助下,能把其他一些调控基因表达的蛋白召集到目标基因的序列上,从而调控目标基因的活性,科学家把这种基于CRISPR/Cas9系统的基因调控方法称为CRISPR干扰(CRISPR interference,CRISPRi)。
科学的进步从来都不是在孤立的领域中独立发生的,不同领域之间常常会相互促进和融合,CRISPR/Cas9基因编辑技术也不例外。在丛乐看来,近年来新兴的光遗传学、诱导多能干细胞(Induced Pluripotent Stem Cell)等技术,在未来都有可能和CRISPR/Cas9基因编辑技术实现整合,为生物学和医学研究提供更加强大的工具。“一个可能的应用是,把光遗传学工具和CRISPR/Cas9系统同时引入动物的特定神经元中”,然后利用光刺激特定神经回路,进而研究疾病和大脑活动。
在基因治疗领域,未来甚至可能把病人的细胞诱导成干细胞,然后用CRISPR/Cas9系统对突变的疾病基因进行修复,再对修复后的干细胞进行诱导,形成相应类型的细胞,植入到病人体内,这样就可以控制甚至治愈疾病。 “不过,这些应用要实现,需要高度精确的基因组编辑和干细胞操作能力,同时还有很多临床上的困难需要克服,”丛乐说。
治疗遗传病
尽管要利用CRISPR/Cas9系统开展基因治疗还有很长的路要走,但科学家已经在实验动物中进行了一些尝试,并取得了令人兴奋的成果。
2013年12月,中国科学院上海生命科学研究院生物化学与细胞生物学研究所的李劲松研究员领导的研究小组,在《细胞·干细胞》(Cell Stem Cell)杂志上报道了他们的研究成果:全球首次成功使用CRISPR/Cas9系统,对患有遗传疾病的动物进行了基因治疗。
在进行基因治疗时,李劲松选取了因基因突变而患上白内障的小鼠作为实验动物。在这种小鼠中,一个叫做Crygc的基因缺失了单个碱基,这导致相应的蛋白合成过程会提前终止,最后产生的蛋白要比正常蛋白短。正是这种突变蛋白的堆积,导致小鼠的晶状体出现病变,从而表现出白内障的症状。也正是这样的原因,使这种突变导致的白内障表现为一种显性突变疾病,也就是说,在小鼠基因组中,只要Crygc基因的两个拷贝中的一个出现突变,就会导致小鼠患上白内障。
把编码Cas9蛋白的mRNA和相应的引导RNA注入含有一个突变Crygc基因的小鼠受精卵之后,研究人员把这些受精卵植入了代孕雌鼠的体内。在这些雌鼠产下的小鼠中,大约30%的小鼠的突变基因得到了修复,这些小鼠不再表现出白内障症状。这种修复甚至不需要引入正常的基因片段作为模板,细胞通过基因组的那个正常Crygc基因拷贝的指导,就能完成修复(实际上,在突变得到修复的小鼠中,有一部分小鼠是通过NHEJ机制,使突变基因多了一个,或者缺失了两个碱基,从而完成修复的。这种碱基的增加或缺失,让小鼠基因上的遗传密码不再“错位”,因而能够合成出长度正常的蛋白质)。进一步研究发现,通过引入外源的同源修复模板,同样能完成基因修复,这一点保证了在未来可以使用同样的策略,对隐性基因突变疾病(基因的两个拷贝都发生突变才能表现出症状的疾病)进行基因治疗。
虽然取得了可喜的研究成果,但李劲松仍然认为,要想把CRISPR/Cas9系统用于疾病的基因治疗,还有很多问题需要解决。除了目前比较低的治愈效率以外(大约30%),“脱靶”也是一个亟待解决的问题,“在临床应用中,不能允许‘脱靶’发生”。另外,如何高效、精准地把CRISPR/Cas9系统送到病人的患病部位等,也是要解决的问题。当被问到还需要多长时间,CRISPR/Cas9系统才能在临床得到应用时,李劲松的态度很谨慎,他认为“CRISPR/Cas9系统在基因治疗上的应用才刚刚起步,还有很长的路要走”,因此很难做出预测。相比之下,丛乐要乐观一些,“如果我们对CRISPR/Cas9系统的基础研究保持足够的关注,并仔细设计各种临床试验,也许10年之后,我们就能够看到这种技术在疾病治疗方面的初步应用。”
由于在基础研究和基因治疗领域的应用潜力,对CRISPR/Cas9技术的关注和投入几乎没有理由会降低。在过去一年间,科学家一直在提高这种技术的精准度,“脱靶率”已经得到了大幅度降低,其应用领域也在不断拓宽:已经在鼠、斑马鱼、果蝇、灵长类动物等10多种生物中得到应用;利用这种技术,科学家实现了对基因表达的调控;在动物实验中,对不止一种遗传疾病进行尝试性地基因治疗……张锋和基因编辑领域的其他几位科学家甚至已经合作创立了一家名叫Editas Medicine的公司,准备以CRISPR/Cas9技术为基础,开发新型的基因疗法。
回到一年多以前,也许很少有人会预料得到,人类对基因进行编辑的能力会在如此短的时间内,从笨拙低效飞跃到近乎随心所欲的程度。虽然CRISPR/Cas9系统目前还不完美,需要进一步完善,但随着这把“剪刀”变得越来越精准,我们有理由相信人类改造和利用基因会变得更加游刃有余。
本文作者 陈彬是《环球科学》特约记者、神经科学博士,致力于报道生物、医学、健康方面的最新进展。
请 登录 发表评论