基因治疗的前世(四):黄金手指(上)

  亲爱的读者们好,非常非常抱歉我又一次跳票了。。最近集中精力写一篇,之后又被杂七杂八的事情烦扰,终于下定决心在暑假开始后认真交文债!

  书接上回。我们在“成也病毒 败也病毒”一文中,讲述了科学家和临床医生们如何利用天然的细胞入侵者-病毒-实现将治病DNA导入患者细胞中,从而解决了基因治疗的第一个技术瓶颈的。在这里,我们继续讲述基因治疗的第二个技术瓶颈是如何被克服的。

  读者们可能还记得,前面故事里讲到的基因治疗的实例,无一例外的都是用在某个基因出现突变、功能的场合。Ashanti DeSilva体内的ADA基因突变功能导致了严重的免疫缺陷,而Jesse Gelsinger罹患的疾病是由于一个有着拗口名字的“鸟氨酸氨甲酰基转移酶”基因缺陷导致。换句话说,我们讲到过的基因治疗的经典案例,都是“缺啥补啥”的治疗思。缺了个基因?没问题,我再给你补一个好的基因进去!这个逻辑虽然简单,但是就和营养不良吃点蛋白质、微量元素不足就吃21金维他(声明:笔者与该公司毫无瓜葛)一样,确确实实能够这些严重遗传病患者的生命。

  但是接下来问题就来了:如果某个遗传病不是因为某个基因失去了功能导致的,而是因为这个基因由于突变“获得”了某种不该有的新“功能”,或者甚至是增强了原来就有的旧“功能”,那么我们描述的这种“缺啥补啥”的基因治疗思就束手无策了。这也正是我们这里要讲到的传统基因疗法的第二个技术瓶颈:缺啥补啥的局限性。

  实际上这样的遗传病确实在在多有。我们可以用鼎鼎大名的亨廷顿舞蹈症(Huntingtons disease)做例子做一点解释。人类四号染色体短臂上有一个名为Htt(Huntington)的基因编码一种与之同名的蛋白质。这个Htt蛋白的确切功能我们还知之甚少,但是这个蛋白有一个惊人的属性,能够与细胞内许许多多蛋白质相互结合(据信可能超过100种!),因此Htt蛋白的一个可能功能就是作为各种功能蛋白的“载体”或者“载具”,协助它们在细胞内的产生、运输、发挥功能、降解等等。

  这个Htt基因有一个有趣的属性,它的DNA序列中有不少C-A-G三个碱基(也即胸腺嘧啶-腺嘌呤-鸟嘌呤的排列)。根据生物学的中心,DNA会通过RNA指导蛋白质的合成。而CAG三碱基所对应的恰好是一个特定的氨基酸-谷氨酰胺。因此,Htt蛋白中也就相应的带有一串数目不等的谷氨酰胺。由于我们细胞内负责DNA复制的蛋白机器遇到不断重复的碱基序列时经常会出错——出错原因倒是也不难理解,读者们如果身处一座楼房街道不断重复出现的城市,大概也会或多或少的有点盲症症状吧——因此我们体内Htt基因上的CAG重复序列的个数,也就是Htt蛋白中谷氨酰胺的个数,经常会发生变化,从几个、十几个到二十几个都会出现。不过可以让我们大概放心的是,看起来不同的谷氨酰胺数目似乎不太会干扰Htt蛋白的正常功能。

  但是一旦Htt基因中CAG重复的数量超过某个阈值(例如40个重复),Htt蛋白的功能就会被深刻和永久性的改变。突变Htt当中的超长谷氨酰胺链获得了一种新的、的能力:它们可以自发形成巨大的蛋白聚合体。它们通过各自的谷氨酰胺序列两两交联,积沙成塔的构成了一个巨大的蛋白三维网络,最终会裹挟着其他与之相结合的蛋白质形成在电子显微镜下清晰可见的深色沉淀。伴随着这一过程,神经细胞的正常功能乃至受到了严重干扰。随着病程的深入,大脑许多区域会随着神经细胞不断的死亡而萎缩并失去功能。其中受到突变Htt蛋白影响的区域叫做纹状体(striatum),正是人体控制肢体运动的中枢之一。因此,亨廷顿舞蹈症患者最早出现的症状之一正是肢体不受控制的随机舞动,而这也正是这种绝症得名的原因。

  亨廷顿舞蹈症很好的诠释了一种靠“缺啥补啥”无法对抗的遗传病类型。在这种疾病中,Htt基因并非由于遗传突变了原有功能,而是由于遗传突变“获得”了某种本来没有的新“功能”(在我们的例子里,这个新功能是通过超长谷氨酰胺链形成巨大的蛋白多聚体的能力)。读者们可以自然而然的想象,在这个故事里单纯利用基因疗法的逻辑给细胞运送一个“正确”的Htt基因,是无法细胞内原有的突变Htt蛋白继续聚集沉淀,从而在数年到数十年的时间里把患者缓慢然而的带入的步伐的。

  首先必须遗憾的告诉我们的读者,在这里看不到你们期待的峰回转的结局:尽管在技术上我们能够在很大程度上避免亨廷顿舞蹈症的新发病例(例如,我们可以对体外受精的胚胎或发育早期的胎儿进行遗传检测,确定其是否携带致病基因,从而进行某种程度的筛选),也可以为患者提供较为周全的对症治疗方案(例如针对其运动机能、认知功能、疾病进行的药物治疗、理疗和运动训练),但是目前亨廷顿舞蹈症仍是不治之症。

  但是人们一直在朝着这个方向努力。既然“缺啥补啥”的思不能解决问题,人们的目光开始转向对人类的遗传信息进行更为精细的。“基因组编辑”(genome editing)的概念随之诞生。与传统基因治疗的思不同,基因组编辑的逻辑在与通过某种手段,修复遗传突变,从而从根本上遗传疾病的产生。从某种程度上说,传统基因治疗就像给濒危建筑打加强筋、装防震梁,延长它的使用寿命就行;而基因组编辑就像是要修葺故宫三大殿,需要严格按照原样”修旧如旧“,还需要把建筑中糟朽不堪的零件取出修缮甚至替换再原封不动的安装回去,目标是让整座建筑精确地恢复原有的机能。两种思间从指导思想到技术线的差异可想而知,而难度更不可同日而语。不过既然两者的目标都是为了通过修改人类DNA治疗遗传疾病,笔者在这个系列故事里就把他们都放到基因疗法这个大框框里进行讨论了。

  好了读者们,现在你们已经知道我们在这里需要征服的目标是什么了:利用某种方法把人类基因组DNA上出现错误的某个、或者某些碱基找出来,然后再把它们修复成正常时候的样子。剩下的问题就是如何实现这个目标了。

  应该说,这个问题的难度不是一般的大。先说锁定目标这一步,要知类基因组DNA约有30亿个碱基对,在其中找到一个特别需要修正的“问题“碱基,如果要一个一个碱基的读下来,哪怕一目十行可能也要读到头晕眼花甚至地荒才找得到。更不要说基因组DNA在细胞内形成了高度复杂的三维结构,想要一个一个碱基顺序读来也是不可能完成的任务。再说修复这一步把,用纯粹机械论的逻辑来规划,替换掉一个出错的碱基,至少需要这么几步:首先要用一双锋利无比、能剪长度只有几埃的化学键的剪刀,把这个问题碱基前后相连的碱基咔嚓咔嚓剪掉;之后用一只机器手抓起问题碱基扔到垃圾桶,再抓来一个正确的碱基;最后,还得用无比精细的针线,把这个新碱基重新和前后的碱基缝起来让它们重新形成一条完整的DNA。

  这远远超越了人类当前的知识和技术储备。不过聪明(或者说懒惰?)的生物学家又一次成功的投机取巧了:和以往一样,他们借用了大自然的力量。他们没有闷头去设计可能永远也造不出来的纳米机器人,而是在自然界寻找亿万年进化中衍生出的天然剪刀、机器手和缝纫机。

  顺便插一句感慨。目前在生物学和医学界大行其道的重要工具,可能无一例外的都来自大自然的鬼斧神工、而非实验室中的人工设计。前文中帮助我们传递治病DNA的,是亿万年来进化出高超的入侵细胞能力的小小病毒。在全球数不清的生物实验室里,生物学家用一种来自水母的、能够在紫外光照射下发出幽幽绿光的蛋白质—绿色荧光蛋白(GFP, green fluorescent protein)追踪细胞中各种物质的产生、运输、和定位。在肿瘤科的病房里,医生们用能够准确的结合癌症相关蛋白的单克隆抗体(mAb, monoclonal antibody)治疗癌症,而抗体之所以有识别和结合蛋白质的能力,是因为在生物体中他们本来就被用于高效识别入侵人体的各种抗原,铸成了人体免疫系统的钢铁长城。大家从新闻上耳熟能详的转基因抗虫棉,是科学家们把一种产生于苏云金芽孢杆菌中的、能够毒杀鳞翅目昆虫的蛋白质通过转基因技术表达在棉花中实现的。甚至连植物转基因技术本身,很大程度上也是依赖于一种天然能够感染植物并将自身遗传物质输入植物细胞中的生物—农杆菌。

  说过,基因组编辑的首要,是怎么从浩若烟海的30亿碱基对中,精确地定位存在缺陷、需要修复的碱基。所幸,进化送给我们的一根能够精确点中问题碱基的黄金手指,它的名字叫锌手指蛋白(Zinc finger protein)。锌手指蛋白的功能,就像是基因组的GPS,只要输入我们想要到达的基因组序列,它就能够帮助我们快速而精确的定位。

  读者们也许听说过生物学的所谓“中心”(central dogma)。这里我会帮助读者们简单理解一下中心的核心思想。我们已经知道,人类的遗传信息被以四种碱基A,T,C,G排列组合的形式,存储在细胞深处的基因组DNA上。这些基因组DNA由两条互补的碱基长链结合构成,每次细胞复制,双链DNA会解开连接,两条单链分别复制出一条与之互补的DNA链从而形成两套信息完全一致的DNA双链(这一过程称为DNA复制/DNA replication)。DNA双链的最重要功能,是指导一个细胞的蛋白质合成,从而决定细胞乃至一个生物个体的性状。这个过程可以粗略分为两步:首先,DNA双链经历解链过程之后,由一个名为RNA聚合酶的蛋白质结合在特定的基因上,并根据DNA序列信息,生产出一条与之互补、但是由核糖核酸构成的单链RNA(这一过程称为/transcription)。之后,RNA单链又根据三个核糖核酸碱基对应一个氨基酸的解码方式,生产出一条蛋白质(这一过程称为翻译/translation)。读者们可以看到,在DNA-RNA-蛋白质的整个过程中,DNA携带的碱基信息被准确无误的转移到RNA上,之后用于指导蛋白质的合成。例如我们前文提到的Htt基因中,每一个CAG三碱基序列都会指导一个特定的氨基酸(谷氨酰胺)加入Htt蛋白序列中。

  尽管中心在不同生物中的具体存在形式存在区别(例如某些病本不存在DNA,直接利用RNA存储遗传信息),但是其基本原则成为了生物体生生不息繁衍的基石。

  那么问题来了。对于人类这样的多细胞生物(人体大约由40-60万亿个细胞所构成)来说,每个细胞中存储的基因组DNA是几乎完全一致的,而每种细胞合成制造的蛋白质却是千差万别:红细胞会制造大量的血红蛋白用于携带氧气,胰岛beta细胞制造和分泌胰岛素调节血糖,毛囊细胞不停地制造角蛋白用于毛发的生长。。一模一样的DNA模版是怎样指导了五花八门的蛋白质合成、从而定义了不同的细胞类型呢?

  这背后的故事可以写一本厚厚的教科书,笔者就不在这里不自量力的展开讲述了。但是有一个调节机制却不能不提:有一类被称为因子(transcription factor)的蛋白质,他们表现的就像是基因组的活地图、GPS。它们能够寻找定位并结合到特定基因附近,通过调节RNA聚合酶的活性来控制各个基因在不同时间、不同地点、不同条件下基因的水平高低。打个简单的比方吧,同样的一套遗传物质之所以会让胰岛beta细胞、并且仅仅是胰岛beta细胞合成胰岛素,可能是因为有一个控制胰岛素基因开关的因子,仅仅会在胰岛beta细胞中露面、结合在胰岛素基因序列的附近,从而启动了胰岛素基因的和胰岛素的产生。

  稍等,稍等。。这里面是不是有我们可以利用的工具?因子既然可以在DNA碱基的海洋里准确的找到它需要结合和调节的基因,这个能力能不能帮助我们找到需要定位和修改的缺陷碱基,从而修复病人身上的遗传缺陷?换句话说,既然这个假想中的控制胰岛素基因开关的因子,可以在每一个胰岛beta细胞中,一次次无比准确的定位到胰岛素基因的附近,那么如果我们理解透了它背后的定位规则并稍加修改,是不是就能让我们准确的找到基因组DNA上任何我们想要定位的碱基呢?

  没错,这个思至少从逻辑上,已经相当接近问题最终的解决方案。在下一章节里,让我们简单闪回一下过去几十年发生在实验室和药厂的精彩瞬间,看看人类利用因子的这一特点,构造形形色色的基因组GPS。

  请期待下一回合:基因治疗的前世(五):黄金手指(中)。我们讲讲科学家们如何从实验室中深刻的理解因子的基因组定位功能,并利用这一特性实现临床意义上的精准修复的。

  更多关于“吃”的科学和科普的精彩文章,请关注我们!点击右上角“查看号”选择订阅,或搜索Neg_Entropy,也可以扫码加入!

手机正文底部

您可以还会对下面的文章感兴趣:

  • 中毒系列(十五)糖尿病友要注意胰岛素中毒
  • 【1378】EGFR突变型NSCLC脑转移患者的治疗策略
  • 女性的:母乳喂养能够减肥!
  • 那些你经常吃却不知道有毒的食物(十二)蜂蜜中毒
  • 早期药物干预可提高患者肺功能
  • 最新评论