当前位置:
首页 > 红细胞系统 > 人类珠蛋白基因的组织结构(血液病学 血红蛋白的结构与功能)

人类珠蛋白基因的组织结构(血液病学 血红蛋白的结构与功能)

导语:人类珠蛋白基因的组织结构属于血液病学下的血红蛋白的结构与功能分支内容。本篇围绕血液病学 人类珠蛋白基因的组织结构主题,主要讲述血红蛋白,珠蛋白,正常人体血红蛋白等方面医学知识。

前面已述,血红蛋白(Hb)是存在于红细胞内的一种主要结合蛋白质,它占红细胞中总蛋白量的90%。Hb由珠蛋白肽链与血红素组成,主要功能是向机体各部分运输氧。Hb不是均一的,正常人红细胞中含有多少种血红蛋白决定于人体发育的不同时期,也就是说人体各个不同发育阶段,合成多肽链种类是不同的,因而由这些多肽链组成不同种类血红蛋白。为了说明这个问题,先讨论人珠蛋白基因的组织结构,然后讨论“血红蛋白基因开关”及人体血红蛋白。

研究证明,人类珠蛋白基因分为α类和β类两大基因簇(下图)。α类珠蛋白基因簇包括4个功能基因和2个无功能基因(又称假基因),位于16号染色体短臂上(区带p13. 2与端粒之间),它以5'端按5'-ζ-ψζ-ψα112-θ- 3'顺序排列,长度为30千碱基对(kb)DNA,其中ζ为胚胎型功能基因,α1、α2和θ为成年型功能基因。θ为新近发现的功能基因,具体功能尚未清楚。ψζ和ψα1为假基因。β类珠蛋白基因簇包括5个功能基因和1个假基因,位于11号染色体短臂上(区带p15),它以5'端按5'-ε- Gγ- Aγ-ψβ-δ-β- 3'顺序排列,长度为60千碱基对(kb)DNA。γ基因有两个,一个是Gγ,另一个是Aγ,二者的表达产物只有136位处氨基酸不同,前者为甘氨酸(Gly),后者为丙氨酸(Ala)。ε为胚胎型功能基因,Gγ、Aγ为胎儿型功能基因,δ、β为成年型功能基因,ψβ为假基因。所谓假基因是一些有缺陷的基因,它们的DNA序列与珠蛋白功能基因的序列有70%~80%的同源性,但是不能编码正常功能的珠蛋白多肽链。在生物进化过程中有些假基因所以能保存下来,推测可能有其尚未清楚的功能。最近假基因序列分析表明有数处阻止正常表达的结构变异,例如,在ψα1结构基因上有很多突变、删除和读码框架位移,因此使75、79和83位上的密码子变成了终止密码,多聚A信号序列突变成了AATGAAA,导致转录产物ψα不能在红细胞中被检出。α和β珠蛋白基因簇中各个基因的核苷序列已测定。

人珠蛋白基因组

人珠蛋白基因簇组织

珠蛋白基因之间由长短不等的DNA顺序间隔,这个顺序称为间隔顺序,例如人β珠蛋白基因簇中ε基因和Gγ基因之间距离为13. 5kb,Gγ和Aγ之间距离为3. 5kb,Aγ和δ之间距离为13. 5kb,δ和β之间距离为5. 5kb,但它们是不编码蛋白质的,其功能还不十分清楚。最近研究发现它们有些部分与基因表达调控有关。

人珠蛋白基因是一个典型的真核基因,基因本身是不连续的,其结构基因(编码蛋白质的)被两个不编码的核苷酸序列隔开,将它分为三段,不编码的顺序为内含子,三段编码部分称为外显子。第一个外显子编码1~31(α类)或1~30(β类)位氨基酸,第二外显子编码32~99(α类)或31~104(β类)位氨基酸,第三外显子编码100~141(α类)或105~146(β类)位氨基酸。每种珠蛋白基因第二外显子是编码血红素“结合袋”的主要组分,第三外显子是α类和非α类珠蛋白接触面的主要成分。α类珠蛋白的基因含2个小的内含子(100~300bp),而β类珠蛋白的基因含1个小的和一个大的内含子(1000~1200bp)。内含子的功能还不十分清楚,但已有资料表明它与基因表达有关。人体珠蛋白基因结构参见图:

人体珠蛋白基因的结构

人类珠蛋白基因簇内还有两种重要的中度核苷酸重复序列:Alu家族和Kpn家族。其名称来源于多数拷贝中存在该酶的位点。α珠蛋白基因簇中含有3个Alu家族成员,β基因簇含有13个Alu和11 个Kpn家族成员。每个Alu重复序列长约300bp,在人染色体中有30万~50万拷贝,占总DNA量的5%左右。Alu重复序列散布在整个基因组内,不仅在基因之前可发现Alu重复序列,而且在内含子及3'非翻译区内也可以发现Alu序列。Alu重复序列的特点是它的3'末端有很多多聚A尾巴,其本身是两个130bp重复序列构成的二聚体。在人β珠蛋白基因簇中已发现有13个Alu序列,在ε基因上游20kb内有7个Alu序列,在Gγ之前和Aγ之后约500bp处各有一个Alu序列,在δ之前和β之后各有一对Alu序列。Alu序列可被转录成RNA,但其具体功能目前尚不清楚。完整的Kpn重复序列长达6. 4kb,在染色体中共有104拷贝,占总DNA的 5%左右,但是在多数情况下,Kpn不是以完整的形式存在,而是以它的某部分片段(长约几百个bp)散布在染色体DNA中。在人β珠蛋白基因簇中已发现有11个长短不一的Kpn重复序列。在β基因3'端有一个可能是完整Kpn序列,长达6. 4kb。在ε 和Gγ基因之间有两个串联的Kpn序列,分别为3kb 和4kb。在ε基因上游有两个方向相反的Kpn序列片段,长约200bp。在γ基因的5'端和3'端,以及Gγ 和Aγ基因之间存在很短的Kpn序列片段(约70bp)。在α珠蛋白基因簇中还未见报道发现Kpn重复序列。有报道Kpn重复序列可转录,但目前未发现其可被转录成RNA的直接证据。

人类珠蛋白基因外显子的核苷酸序列是非常固定的,但其中非编码部分(内含子和间隔序列)则有些变化,不十分固定。在正常情况下,某些核苷酸位点发生中性突变,这种变化称为珠蛋白基因的多态性。多态性位点是一种遗传标志,它对珠蛋白基因表达并不产生影响,分子生物学家可以利用这种性质,对某些遗传疾病(如某些异常Hb病、地中海贫血症)进行基因诊断。