遗传密码( 四 )


遗传密码

文章插图
遗传密码 在经典遗传学中 , 终止密码子各有名称:UAG为琥珀(amber) , UGA为蛋白石(opal) , UAA为赭石(ochre) 。这些名称来源于最初发现到这些终止密码子的基因的名称 。终止密码子使核糖体和释放因子结合 , 使多肽从核糖体分离而结束转译的程式 。另外 , 在哺乳动物的线粒体中 , AGA和AGG也充当终止密码子 。简併性大部分密码子具有简併性 , 即两个或者多个密码子编码同一胺基酸 。简併的密码子通常只有第三位硷基不同 , 例如 , GAA和GAG都编码谷氨醯胺 。如果不管密码子的第三位为哪种核苷酸 , 都编码同一种胺基酸 , 则称之为四重简併;如果第三位有四种可能的核苷酸之中的两种 , 而且编码同一种胺基酸 , 则称之为二重简併 , 一般第三位上两种等价的核苷酸同为嘌呤(A/G)或者嘧啶(C/T) 。只有两种胺基酸仅由一个密码子编码 , 一个是甲硫氨酸 , 由AUG编码 , 同时也是起始密码子;另一个是色氨酸 , 由UGG编码 。遗传密码的这些性质可使基因更加耐受点突变 。例如 , 四重简併密码子可以容忍密码子第三位的任何变异;二重简併密码子使三分之一可能的第三位的变异不影响蛋白质序列 。由于转换变异(嘌呤变为嘌呤或者嘧啶变为嘧啶)比颠换变异(嘌呤变为嘧啶或者嘧啶变为嘌呤)的可能性更大 , 因此二重简併密码子也具有很强的对抗突变的能力 。不影响胺基酸序列的突变称为沉默突变 。简併性的出现是由于tRNA反密码子的第一位硷基可以和mRNA构成摆动硷基对 , 常见的情况为反密码子上的次黄嘌呤(I) , 以及和密码子形成非标準的U-G配对 。
遗传密码

文章插图
三联体密码錶以及tRNA的反密码子与mRNA的密码子的配对另一种有助对抗点突变的情况 , 是NUN (N代表任何核苷酸) 倾向于代表疏水性胺基酸 , 故此即使出现突变 , 仍有较大机会维持蛋白质的亲水度 , 减低致命破坏的可能 。阅读框“密码子”是由阅读的起始位点决定的 。例如 , 一段序列GGGAAACCC , 如果由第一个位置开始读 , 包括3个密码子GGG , AAA和CCC 。如果从第二位开始读 , 包括GGA和AAC(忽略不完整的密码子) 。如果从第三位开始读 , 则为GAA和ACC 。故此每段序列都可以分为三个阅读框 , 每个都能产生不同的胺基酸序列(在上例中 , 相应为Gly-Lys-Pro , Gly-Asp , 和Glu-Thr) 。而因为DNA的双螺旋结构 , 每段DNA实际上有六个阅读框 。实际的框架是由起始密码子确定 , 通常是mRNA序列上第一个出现的AUG 。破坏阅读框架的变异(例如 , 插入或删除1个或2个核苷酸)称为阅读框变异 , 通常会严重影响到蛋白质的功能 , 故此并不常见 , 因为他们通常不能在演化中存活下来 。非标準的遗传密码虽然遗传密码在不同生命之间有很强的一致性 , 但亦存在非标準的遗传密码 。在有“细胞能量工厂”之称的线粒体中 , 便有和标準遗传密码数个相异的之处 , 甚至不同生物的线粒体有不同的遗传密码 。支原体会把UGA转译为色氨酸 。纤毛虫则把UAG(有时候还有UAA)转译为谷氨醯胺(一些绿藻也有同样现象) , 或把UGA转译为半胱氨酸 。一些酵母会把GUG转译为丝氨酸 。在一些罕见情况 , 一些蛋白质会有AUG以外的起始密码子 。真菌、原生生物和人以及其它动物的粒线体中的遗传密码与标準遗传密码的差异 , 主要变化如下:密码子通常的作用例外的作用所属的生物UGA中止编码色氨酸编码人、牛、酵母线粒体 , 支原体(Mycoplasma)基因组 , 如CapricolumUGA中止编码半胱氨酸编码一些纤毛虫(ciliate)细胞核基因组 , 如游纤虫属(Euplotes)AGR精氨酸编码中止编码大部分动物线粒体 , 脊椎动物线粒体AGA精氨酸编码丝氨酸编码果蝇线粒体AUA异亮氨酸编码蛋氨酸编码一些动物和酵母线粒体UAA中止编码谷氨醯胺编码草履虫、一些纤毛虫(ciliate)细胞核基因组 , 如嗜热四膜虫(ThermophAilus tetrahymena)UAG中止编码谷氨酸编码草履虫核细胞核基因组GUG缬氨酸编码丝氨酸编码假丝酵母核基因组AAA赖氨酸编码天冬氨酸编码一些动物的线粒体 , 果蝇线粒体CUG亮氨酸编码中止编码圆柱念珠菌(Candida cylindracea)细胞核基因组CUN亮氨酸编码苏氨酸编码酵母线粒体 按信使RNA的序列 , 在一些蛋白质里停止密码子会被翻译成非标準的胺基酸 , 例如UGA转译为硒半胱氨酸和UAG转译为吡咯赖氨酸 , 随着对基因组序列加深了解 , 科学家可能还会发现其它非标準的转译方式 , 以及其它未知胺基酸在生物中的套用 。结构基因一个生物体携带的全套遗传信息 , 即基因组 。具体化学分子是DNA线状分子 。分子中每个有功能的单位被称作基因 , 每个基因均是由一连串单核苷酸组成 。能编码蛋白质的基因称为结构基因 。结构基因的表达是DNA分子通过转录反应生成线状核酸RNA分子 , RNA分子在翻译系统的作用下翻译成蛋白质 。每个单核苷酸均由硷基 , 戊糖(即五碳糖 , DNA中为脱氧核糖 , RNA中为核糖)和磷酸三部分组成 。硷基不同构成了不同的单核苷酸 。组成DNA的硷基有腺嘌呤(A) , 鸟嘌呤(G) , 胞嘧啶(C)及胸腺嘧啶(T) 。组成RNA的硷基以尿嘧啶(U)代替了胸腺嘧啶(T) 。三个单核苷酸形成一组密码子 , 而每个密码子代表一个胺基酸或终止信号 。在蛋白质合成的过程中 , 基因先被从DNA转录为对应的RNA模板 , 即信使RNA(mRNA) 。接下来在核糖体和转移RNA(tRNA)以及一些酶的作用下 , 由该RNA模板转译成为胺基酸组成的链(多肽) , 然后经过翻译后修饰形成蛋白质 。因为密码子由三个核苷酸组成 , 故一共有43=64种密码子 。例如 , RNA序列UAGCAAUCC包含了三个密码子:UAG , CAA和UCC 。这段RNA编码了代表了长度为3个胺基酸的一段蛋白质序列 。(DNA也有类似的序列 , 但是以T代替了U) 。一代密码遗传密码是由核苷酸组成的三联体 。翻译时从起始密码子开始 , 沿着mRNA的5′——3′方向 , 不重叠地连续阅读胺基酸密码子 , 一直进行到终止密码子才停止 , 结果从N端到C端生成一条具有特定顺序的肽链 。“遗传密码”一词 , 现在被用来代表两种完全不同的含义 , 外行常用它来表示生物体内的全部遗传信息 。分子生物学家指的是表示四个字母的核酸语言和20个字母的蛋白质语言之间关係的小字典 。要了解核苷酸顺序是如何决定胺基酸顺序的 , 首先要知道编码的比例关係 , 即要弄清楚核苷酸数目与胺基酸数目的对应比例关係 。从数学观点考虑 , 核酸通常有四种核苷酸 , 而组成蛋白质的胺基酸有20种 , 因此 , 一种核苷酸作为一种胺基酸的密码是不可能的 。如果两种核苷酸为一组 , 代表一种胺基酸 , 那幺它们所能代表的胺基酸也只能有42=16种(不足20种) 。如果三个核苷酸对应一个胺基酸 , 那幺可能的密码子有43=64种 , 这是能够将20种胺基酸全部包括进去的最低比例 。因此密码子是三联体(triplet) , 而不是二联体 , (duplet) , 更不是单一体(singlet) 。国际公认的遗传密码 , 它是在1954年首先由盖莫夫提出具体构想 , 即四种不同的硷基怎样排列组合进行编码 , 才能表达出20种不同的胺基酸 。1961年 , 由尼伦伯格等用大肠桿菌无细胞体系实验 , 发现苯丙氨酸的密码就是RNA上的尿嘧啶UUU密码子 , 到1966年 , 64种遗传密码全部破译 。在64个密码子中 , 一共有三个终止密码子 , 它们是UAA、UAG和UGA , 不与tRNA结合 , 但能被释放因子识别 。终止密码子也叫标点密码子或叫无意义密码子 。有两个胺基酸密码子AUG和GUG同时兼作起密码子 , 它们作为体内蛋白质生物合成的起始信号 , 其中AUG使用最普遍 。密码的最终破译是由实验室而不是由理论得出的 , 遗传密码体现了分子生物学的核心 , 犹如元素周期表是化学的核心一样 , 但二者又有很大的差别 。元素周期表很可能在宇宙中的任何地方都是正确的 , 特别是在温度和压力与地球都相似的条件下 。但是如果在其他星球也有生命的存在 , 而那种生命也利用核酸和蛋白质 , 它们的密码很可能有巨的差异 。在地球上 , 遗传密码只在某些生物中有微小的变异 。克里克认为 , 遗传密码如同生命本身一样 , 并不是事物永恆的性质 , 至少在一定程度上 , 它是偶然的产物 。当密码最初开始进化的 , 它很可能对生命的起源起重要作用 。二代密码对生命遗传信息存储传递及表达的认识是20世纪生物学所取得的最重要的突破 。其中的关键问题是由3个相连的核苷酸顺序决定蛋白质分子肽链中的1个胺基酸 , 即“三联遗传密码”(‘第一遗传密码“)的破译 。但是蛋白质必须有特定的三维空间结构 , 才能表现其特定的生物功能 。50年代Anfinsen提出假说 , 认为蛋白质特定的三维空间结构是由其胺基酸排列顺序所决定的 , 并因此获得诺贝尔奖.这一论断现在已被广泛接受 , 大量实验充分说明胺基酸顺序与蛋白质空间结构之间确实存在着一定的关係 。遗传信息的传递 , 应该是从核酸序列到功能蛋白质的全过程.现有的遗传密码仅有从核酸序列到无结构的多肽链的信息传递 , 因此是不完整的.本文讨论的是从无结构的多肽链到有完整结构的功能蛋白质的信息传递部分 。完整的提法应该是遗传密码的第二部分 , 即蛋白质中胺基酸序列与其空间结构的对应关係 , 国际上称之为第二遗传密码或摺叠密码(以下简称第二密码) 。Anfinsen原理认为 , 和一定的胺基酸序列相对应的空间结构是热力学上最稳定的结构 , 但多肽链摺叠成为相应的空间结构在实际上还存在一个“这一过程是否能够在一定时间内完成”的动力学问题 。事实上蛋白质最稳定结构与一些相似结构之间的能量差并不大 , 约在20.9~83.7kJ/mol左右 。蛋白质之所以最容易形成天然结构除能量因素外 , 是由动力学和熵的因素所决定的 。近10余年来国际上在蛋白质天然结构形成的问题上发生了概念上的变革 。过去曾经认为新生肽链能够自发地摺叠成为完整的空间结构 , 分子伴侣的发现已经把过去经典的自发摺叠概念转变为 , 有帮助的肽链的自发摺叠和组装“的新概念” 。“自发”是指由第二遗传密码决定摺叠终态的“内因”亦即热力学因素 , 而“帮助”则是为保证该过程能高效完成的“外因” , 是由一类新发现的分子伴侣蛋白和摺叠酶来帮助完成的 , 主要是帮助克服动力学和熵的障碍 , 因而帮助克服细胞内由各种因素引起摺叠错误并造成翻译后多肽链分子的聚集沉澱而最终导致信息传递中止 。新生肽成熟为活性蛋白的过程中 , 不仅有摺叠中间体与分子伴侣和摺叠酶的相互作用 , 还有亚基间相互作用而组装成有功能的多亚基蛋白 , 以及错误摺叠分子与特异蛋白水解酶的识别和作用以从细胞内清除构象错误的分子等 。细胞内摺叠过程也是一个蛋白分子内和分子间肽链相互作用的过程.细胞内新合成的多肽链浓度极高 , 这种“拥挤”状态会加剧蛋白分子间的错误相互作用而导致分子聚集 。医学套用人类基因图谱的遗传密码序列最近即将全部揭晓 , 科学家大胆地预测医学即将进入分子医学与基因治疗的时代 , 我们不仅可以利用分子医学或生物晶片的方法 , 找出有问题的致病分子 , 利用基因工程的方法加以改造 , 进行所谓“基因治疗“ , 还可以分析某某人的全部遗传密码序列 , 提前预测将来发生某种疾病的倾向 。一切似乎非常完美 , 真的是如此吗? 临床的疾病 , 真正属于单一基因发生突变的仍属少数 , 大部分的疾病依旧原因不明 , 据推测多基因(Polygenic)或多因子(Polyfactorial)的原因占了大宗 。单基因的疾病 , 例如苯酮尿症(Phenylketonuria)、舞蹈症(Huntington’sChorea)、地中海型贫血(beta-Thalassemia)等只占了很小的比例 , 常见的疾病 , 例如高血压、糖尿病、退化性关节炎、老人失智症 , 可能是好几个基因出了问题 , 加上环境的因素的影响 。对于单基因的疾病 , 现在可以套用遗传连锁(Linkagestudy)的方法 , 将致病基因定位(Positionalcloning) , 再破解遗传密码 , 但是多基因或多因子造成的疾病 , 目前并没有可行的遗传学理论或实验方法 , 可以用来找到所有可能相关的基因 。因为受到医学伦理的约束 , 基因治疗的临床价值迄今仍未得到证明 。基因治疗最早是针对ADA(Adenosinedeaminase)缺乏引起的免疫缺乏症(泡泡娃娃 , Bubblebaby) , 由美国国家卫生院的FrancisAnderson等人主持 , 他们取出病人的骨髓细胞 , 用基因工程的技术加以改造 , 修补其免疫缺损 , 再重新输回病人的身体 , 基因治疗的同时 , 病人也接受ADA酵素的治疗 , 研究人员担心万一基因治疗无效 , 因此不敢贸然停止ADA的使用 , 基因治疗究竟是否有效 , 并没有客观的结论 。1980年代有学者在国际知名的Nature杂誌上发表研究论文 , 指出精神分裂症及躁郁症与遗传的关係 , 精神分裂症的基因被定位于第五对染色体 , 躁郁症的基因则位于第十一对染色体 , 后来相关的研究并不能重複这些结果 , 因此早先发表的文章遭到撤回 , 试想高血压 , 糖尿病究竟是单基因、多基因、或者环境因素所造成 , 迄今仍原因未明 , 更何况这些複杂的精神疾病!人类行为的遗传模式到现在仍不清楚 , 大部分精神分裂症及躁郁症的病人都是偶发的个案 , 偶而有家族史 , 但是很少有三代以上的家族病史 , 无法套用目前基因连锁定位(Linkagestudy)来做致病基因的染色体定位;大部分的病人多半在二十岁左右发病 , 不容易找到对象结婚 , 因此精神疾病如果完全是由于遗传基因的作用 , 他们的遗传基因也很难传递到下一代 , 但是人口中精神分裂症及躁郁症的病人所占的比例始终约略小于百分之一 , 这种现象很难以现有的遗传学理论解释;精神疾病目前诊断的方式 , 仍然以症状诊断为主 , 始终缺乏生物性的诊断方法 , 譬如抽血检查血液中的化学物质 , 或者影像学的检查 , 看看脑部那个结构出了问题;精神疾病的异质性(Heterogenecity)相当高 , 增加研究的困难度 , 很难区分究竟是先天遗传或者后天环境造成 。1980年代曾有学者以美国东部Amish族群作为研究躁郁症的对象 , 后来因为少数几个个案的诊断有疑义 , 整的研究结果受到质疑 。自从Watson及Crick于1953年发表DNA的论文之后 , 分子生物学一日千里 , 经由国际上许多科学家的协同努力 , 今天终于揭开人类的遗传密码序列 , 但是行为科学与精神医学连入口在哪里 , 现在都还不知道 , 之所以如此艰难 , 是因为到目前为止 , 连最基本的心智功能都没有明确的定义 , 更遑论要整合各种研究的结论 , 例如记忆(Memory)就有好多种分法 , 譬如分成即时记忆、短程记忆及长程记忆 , 也可分为明确记忆(Explicitmemory)及隐含记忆(Implicitmemory) , 加上工作状态记忆(Workingmemory)等等;大脑可以记忆 , 小脑也有记忆能力 , 例如开车 , 遇到紧急状况踩煞车 , 通常是反射动作 , 不经过大脑考虑 , 单单对于记忆的了解就如此凌乱 , 其他如情绪、知觉、理解力、逻辑推理能力等等 , 迄今仍是浑沌一片 。乐观的看来 , 最近这十年 , 或者最近这一百年 , 不会有太大进展 , 悲观的一派则认为人类的心智永远没有解答 , 除非遗传学以及神经科学理论的基本架构有划时代突破性的发现 。意义第一密码的阐明解决了基因在不同生物体之间的转移与表达 , 开闢了遗传工程和蛋白工程的新产业 。但是在异体表达的蛋白质往往不能正确摺叠成为活性蛋白质而聚集形成包含体 。生物工程的这个在生产上的瓶颈问题需要第二密码的理论研究和摺叠的实验研究来指导和帮助解决 。由于分子伴侣在新生肽链摺叠中的关键作用 , 它一定会对提高生物工程产物的产率有重要的实用价值 。蛋白工程的兴起 , 已经使人们不再满足于天然蛋白的利用 , 而开始追求设计自然界不存在的全新的具有某些特定性质的蛋白质 , 这就开闢了蛋白设计的新领域 。前面提到的把原来主要是β-摺叠结构改变为一个主要是α-螺旋的新蛋白的设计就是这方面的一个例子 , 更多的努力将集中于有实用意义的蛋白设计上 。近年来得知某些疾病是由于蛋白质摺叠错误而引起的如类似于疯牛病的某些神经性疾病老年性痴呆症帕金森氏症 。这已引起人们极大的注意 。异常刺激会诱导细胞立即合成大量应激蛋白帮助细胞克服环境变化 , 这些应激蛋白多半是分子伴侣 。由于分子伴侣在细胞生命活动的各个层次和环节上都有重要的甚至关键的作用 , 它们的表达和行为必然与疾病有密切关係.如局部缺血化疗损伤心脏扩大高烧炎症感染代谢病细胞和组织损伤以及老年化都与应激蛋白有关 。因此在医学上不仅开闢了与分子伴侣和应激蛋白有关的新的研究领域 , 也开创了广阔的套用前景 。