基因治疗的前世(五):黄金手指(中)

  欢迎回来!本章继续讲述锌手指蛋白的故事。它到底是什么?它是如何被发现的?它又如何帮助我们精准定位基因组DNA?

  在现代生物学和医学的历史上,很少有一个,能够用一己之力架起从最基本的生命现象到最强有力的疾病治疗之间的桥梁。事实上,人类探索未知世界的规律,以及利用这些规律更好的武装和自身的过程,总是充满了意外、挫折、惊喜和,从来不是能够来了开头就猜出结尾的浪漫肥皂剧。而对于热衷于科普的笔者来说,这意味着在几千字的篇幅里楚从实验室到诊室的故事经常成了一种无比的体验。

  所幸这一次,我们要讲述的是人类探索史上少有的浪漫轻喜剧。一个叫做TFIIIA的神奇,了几十年中一系列巧合以及巧合带给我们的惊喜。

  已经在美国中部久负盛名的大学圣易斯分校(Washington University at St. Louis)任教四年有余的罗伯特.里德(Robert G. Roeder)有充分的理由志得意满。仅仅三十出头的他在十几年的科学研究生涯中几乎每一步都踩在了历史的鼓点上。早在读研究生期间,他利用生物化学方法,首次从动物细胞中提取和纯化出了三个能够以基因组DNA为模板、精确的出RNA单链的蛋白质—RNA聚合酶I,II和III三兄弟。尽管早在上个世纪五十年代人们已经提炼出生物学的中心,认为基因组DNA正是通过(即基于DNA模板的RNA合成)-翻译(即基于RNA模板的蛋白质合成)的径决定了我们身体得到大多数特性,但是里德的发现第一次从物质层面上说明了DNAàRNA这一过程的生物学机理。这一里程碑式的发现迅速进入教科书,至今仍是生物专业的大学生必修的基本概念之一。而在里德拿到博士学位、前往圣易斯开始自己的研究生涯之后,里德和他的研究生和博士后们再接再厉,了RNA聚合酶三兄弟的不同功能特性,解释了为什么我们身体里需要三种、而不是一种RNA聚合酶来作中心的执行者。

  然而某种来自本能的挑剔始终在着里德先生。这是一个习惯于24X7工作的、严谨的近乎刻板的生物化学家。数十年如一日在周六清晨开实验室组会、习惯深更半夜打电话给实验室确认实验进展(而他自己早年正是这么做的:当他还是学生的时候,发现RNA聚合酶的那天夜里直接一个电话把导师从床上捞了起来)。生物化学的训练和思维方式已经写进了他的大脑和骨髓里:而他的正是这个。

  在一个古板的生物化学家看来,生命体,或者至少是细胞的所谓“生命”,实质上无非是许许多多化学物质混合反应的产物。因此生物化学家的最高理想,就是能把决定“生命”的许许多多物质找出来,小心的按照一定比例混合在试管里,在试管中“创造”生命本身,或者至少“重现”生命的部分特征。按照同样的思,里德在这几年一直在努力做一件事情:他和学生们用非洲爪蟾卵母细胞作为原料,提纯了他自己在学生时代发现的RNA聚合酶III,之后又想办法把细胞中的染色体DNA给提纯了出来。在一个生物化学家的世界里,把RNA聚合酶III和染色体DNA混合在一起,“砰”的一声,RNA应该就会被合成出来。

  里德没有猜错,1977年他和自己的博士后Carl Parker发表在《美国科学院院报》上发表了一篇学术论文,令人信服的说明,RNA聚合酶+染色体DNA,确实会在试管里出50倍于本底值的RNA合成,新生的5S RNA(一种特别的RNA,能够被RNA聚合酶的合成)能够在上清晰可见。

  然而问题在于,所谓染色体DNA,指的是我们的基因组DNA在体内、和许许多多蛋白交缠在一起形成的复杂物质。我们知道,基因组DNA是两条缠绕在一起的碱基链构成,如果把人类基因组DNA拉直放平,总长度大概有2米开外,而直径只有不值一提的数埃(1埃=一百亿分之一米),这样的结构是无论如何看不到、也塞不到小小的微米尺度的细胞里面去的。所以在体内,基因组DNA是被大量的蛋白质折叠、包装之后形成的直径达到微米数量级(扩大了上万倍)、而长度同时缩小到微米数量级(缩小了百万倍)之后形成的结构,因为能够被染料识别、在粗糙的光学显微镜下清晰可见,所以被成为染色体。

  因此,证明了RNA聚合酶+染色体DNA能够在试管内发挥功能,显然不能让刻板的生物化学家里德先生满意。天知道染色体DNA上还包裹携带了什么东西!但是从此里德的麻烦就来了。里德和Parker在1977年同一篇论文中也发现,如果用的化学方法去掉染色体DNA上的蛋白质,只留一条光秃秃的DNA链,加上再多的RNA聚合酶也无法产生足量的5S RNA。这个发现说明,里德实验室的“试管化”功夫还没有做到家,存在于染色体DNA上的某些未知物质,对于生命体利用DNA合成RNA是不可或缺的。

  在接下来的三年可能是里德实验室最有效率的时光。目标很简单:找到这个未知的物质!他们用到的方法是这样的:首先他们准备好光溜溜的DNA,随后,把细胞打碎、收集,然后过筛子分离。再把分离出的不同组分一点一点加到光溜溜的DNA上,看看是否可以观察到合成的RNA。如果发现某个组分具备这种能力,就继续用各种筛子分离这个组分中的小组分,然后继续丢到DNA上看是否产生RNA。。直到最终从细胞内上万种蛋白质中找到一两种能够激活RNA的蛋白质。

  这是件极其繁琐、但是又非常聪明和有效的活儿。读者们可以简单想像这样的场景,给你一万颗传说中的龙珠,要求你从中间找出唯一那个能够神龙的一颗。一颗一颗机械的试下去是不行的,神龙很快会不耐烦,你的人生也有限(!)。于是你的方法是,首先把龙珠们按照个头大小分成10组,每组大约一千颗吧,然后用卡车一卡车一卡车的运给神龙看。好,原来是第三卡车那一千颗龙珠有魔法啊,能神龙啊,那你再继续根据红黄蓝白黑的颜色,把这一千颗继续分成10组,用笸箩一笸箩一笸箩装给神龙看。好,原来是红色那一笸箩啊,于是在根据质地分分组、根据重量分分组。。按照这个逻辑分下去,其实只要分类五次,每次十组,就可以很快找到一万颗龙珠中间真正能神龙的那一颗(10的5次方=10000)。但是这分类五次的学问可就大了,从哪里搞到这一万颗龙珠,每次按照什么标准分组,分几组,怎么试验能不能神龙,等等等等。这是最神龙者,阿不,生物化学家的时刻。而里德实验室深厚的生物化学功底帮助了他们。

  最后在1980年,寻找龙珠的努力开花结果。在1980年发表的几篇学术论文中,里德和他的学生们发现了一系列能够帮助RNA聚合酶,在裸露的DNA上启动RNA合成的“辅助”蛋白。基于它们对DNAàRNA过程的作用,这些被赋予了一个新名字:因子(TF, transcription factor)。其中一个这样的因子,叫做TFIIIA(顾名思义,就是能够促进RNA聚合酶III的、第一个被发现的因子)。

  TFIIIA是我们故事的主角。在发表于1980年《细胞》上的论文中,里德他们发现,这种因子有个异常有趣的特性。和同时期里的他们发现的许多因子(例如TFIIIB/C,TFIIB/D/E/F/H等等)不同,TFIIIA不是对所有DNA区域的都重要。它仅仅能够刺激一种非常特别的RNA,5S RNA的产生。进一步的分析说明,TFIIIA能够非常紧密的结合在DNA序列上,而且恰恰是编码5S RNA的那一段!这个现象说明,TFIIIA蛋白可能能够通过识别和结合5S RNA基因序列,性的启动了这个基因的表达。这个发现的意义是怎么强调都不为过的。因为这一现象至少提示了一个重要的可能性,即每个细胞中一模一样的DNA,可能由于不同因子的存在,在不同细胞中合成出了千变万化的蛋白质。可以说整个发育生物学,以及整个遗传信息调控网络的研究,都源自三十年前这个划时代的发现。

  然而对于我们的故事来说精彩才刚刚开始。1983年,纽约州立大学石溪分校的Cheng-wen Wu实验室发现,TFIIIA蛋白结合DNA的能力需要一个金属离子:锌离子。1984年,里德实验室鉴定出了编码TFIIIA的蛋白质基因序列,使得人们可以容易的在实验室中大量生产TFIIIA,这个神奇的线年,来自英国MRC的Klug实验室证明,每个TFIIIA蛋白都是由九个长相接近的片段连接而成的,每个片段都含有大约30个氨基酸以及几个锌离子。在科学家的想象中,这30个氨基酸围绕在锌离子的周围,形成了类似手指一样的立体结构,从而能够识别出特定的DNA三碱基序列。而TFIIIA的九个手指结构因此就具备了识别一个特定的3X9=27碱基序列的高超能力,帮助它在汪洋大海般的DNA碱基中准确的定位到了5S RNA基因。

  1985年,Klug在论文中想像的锌手指结构(左)和蛋白质晶体学家利用X射线衍射所获得的锌手指蛋白的三维结构(右)。左图中,围绕锌离子(Zn)形成了特别的蛋白质“手指”,在右图中也得到了印证。由图中橙色代表的是DNA双螺旋。

  于是,大自然送给基因科学家的礼物,锌手指蛋白(zinc finger protein)终于进入了人们的视野。

  锌手指蛋白的故事还有很多很多,站在它背后的,从某种意义上是整个生物学的黄金时代。在上个世纪十年代,许许多多的因子被发现和研究,其中有很多至今仍被不断地提及。例如第一个人类因子SP1(大学伯克利分校钱泽南/Robert Tjian);受到病原体的刺激所激发、负责启动人体免疫响应的因子NF-kappaB(洛克菲勒大学David Baltimore),在癌症和抗癌的斗争中鼎鼎大名的p53、Rb和Myc,等等等等。这些信息帮助我们进一步理解了生命现象的复杂,特别是同一套遗传物质如何造就五光十色的细胞类型和人类个体。

  锌手指结构提示了一个非常诱人的可能性:既然每一个大约30个氨基酸构成的、包含锌离子的锌手指结构能够的识别和结合独特的一组DNA三碱基序列(由A/T/C/G四个碱基排列而成),那么如果自然界存在足够多样的锌手指蛋白,我们是不是可以从中筛选出各种各样的锌手指结构,可以覆盖全部64种可能的三碱基序列组合(4X4X4=64)?而如果这样的线种锌手指进行组合,我们是不是就可以轻易地定位到基因组上任何我们需要寻找的序列了?这是不是就是我们一直在讨论、但从未找到过的基因组GPS呢?之后如果我们再找到传说中的基因组剪刀和缝纫机,我们是不是就可以的编辑改写我们的基因组了呢?

  好事成双,1996年,人们同时找到了基因组GPS和剪刀,定点修改基因组的理想出现了技术上的可能性。

  应该说这又是一段有些喜剧色彩的历史。在美国东海岸的约翰.霍普金斯大学任教的Srinivasan Chandrasegaran最终成为基因组GPS的发现者,但他本人其实反倒是研究基因组剪刀功能的!

  Chandrasegaran实验室的研究兴趣主要是一类能够剪切基因组DNA的蛋白质:性内切酶。这类蛋白质的功能是在DNA双链的某个特定区域咔嚓一刀,把DNA长链从中切断。例如Chandrasegaran实验室关注的一个名叫FokI的性内切酶,能够切断任何带有GGATG-CATCC回文序列的DNA链。1994年,Chandrasegaran实验室发现,FokI蛋白有一个有别于很多性内切酶、非常有趣的特点。它识别GGATG-CATCC回文序列和切割这个序列的功能是完全分离的:蛋白的前半部分专门负责定位,后半部分则专门负责剪切。他们还令人信服的证明,通过修改FokI蛋白的前半部分,可以让FokI蛋白完美的更换剪切的目标序列。

  值得指出的是,性内切酶虽然同时具备定位基因组序列和切割的能力,但是用其基因组定位功能来做基因组编辑是不太现实的。因为大多数性内切酶一般只能识别个位数的碱基序列,而在人类基因组中任何一个六七个碱基的组合重复出现的概率实在是太高太高了,高到技术上失去了任何性。因此,已经剪刀手在握的Chandrasegaran实验室的目光所及,是所有带有基因组GPS功能的活地图。

  1996年,Chandrasegaran实验室终于让锌手指蛋白和FokI剪刀手走到了一起。他们在FokI剪刀手的一端连接上三个不同的锌手指结构,随后观察这个杂种蛋白到底会剪切什么样的DNA序列。我们已经知道,每个锌手指结构能够识别一个特定的DNA三碱基,因此三个锌手指结构应该能帮助我们把DNA剪刀手准确的运送到一个特定的九碱基位点上去。实验取得了完美的成功,两个人工构造的杂种蛋白毫无悬念的准确的找到了这个九碱基位点并痛下杀手。九碱基序列本身当然还远不足以帮助人们在30亿人类基因组碱基中定位,但是这个实验结果已经明白无疑的告诉我们,基因组编辑的时代,至少在理论储备上接近成熟了。

  所以,我们本节的明星TFIIIA,在研究生命最基本现象—DNA的—的大学实验室中被发现,在短短十六年之后,就开始我们根据大自然的美妙规律,编辑自身基因组、战胜遗传疾病了。

  每想到这里,我都会对孜孜以求破解自然奥秘的科学家们心生。而作为生物医学研究的大同行和小晚辈,我也会不由自主羡慕前辈们的好脑筋和好运气。

  请期待下一回合:基因治疗的前世(六):黄金手指(下)。离开实验室,让我们看看锌手指内切酶是否真的可以帮助遗传疾病的患者重获健康。

手机正文底部

您可以还会对下面的文章感兴趣:

  • 中毒系列(十五)糖尿病友要注意胰岛素中毒
  • 【1378】EGFR突变型NSCLC脑转移患者的治疗策略
  • 女性的:母乳喂养能够减肥!
  • 那些你经常吃却不知道有毒的食物(十二)蜂蜜中毒
  • 早期药物干预可提高患者肺功能
  • 最新评论