王传超
复旦大学现代人类学教育部重点实验室,邮编200433
父系Y染色体介绍
人体内有23对染色体,其中22对常染色体中,每一对染色体都有一条来自父系,一条来自母系,两条染色体在传代过程中对应的部分会发生交换,从而造成混血的效应,就是遗传学上说的重组。另一对性染色体包括X染色体和Y染色体。在女性体内,X染色体也是成对的,分别来自父母双方,所以也不能避免混血的影响。而在男性体内,却只有一条来自母亲的X染色体和一条来自父亲的Y染色体,也就是说男性的Y染色体只能来源于父亲,所以人体性染色体的遗传方式决定了Y染色体遵从严格的父系遗传。

图1. Y染色体谱系树及其在各大洲的分布
Y染色体上有一类突变形成的个体差异——单核苷酸多态(SNP),根据SNP可将全世界的Y染色体分为20种主干类群,编号从A到T,这些类群被称为:单倍群。最古老的A和B单倍群都没有走出非洲,C和D单倍群最早来到了澳洲和亚洲,E单倍群来到了亚洲又绝大部分回流到非洲,F单倍群衍生出GHIJ等单倍群在欧亚大陆西部形成欧罗巴人种,衍生出K单倍群并形成NOPQ等单倍群在欧亚大陆东部形成蒙古人种,其中O单倍群成为了中国人的主流,而Q单倍群成为美洲印第安人的主流,单倍群N在欧亚大陆北部广泛分布,从远东一直到延伸到东欧的高纬度地区,尤其是乌拉尔语系群体中;单倍群R由两个下游单倍群R1和R2组成,R1广泛分布在西部欧亚、南亚和中亚,单倍群R2则主要出现在亚洲,特别是印度次大陆和中亚地区。单倍群T在欧洲以及中东、北非和西非的部分地区有低频的出现,单倍群M的地理分布局限于大洋洲和印度尼西亚东部,S则是巴布新几内亚高原地区的主要单倍群。需特别强调出来的是单倍群O及其下游单倍群O3、O1和O2等,单倍群O3在东亚达到最高的频率,特别是在中国的汉族群体中,单倍群O1和O2主要存在于中国南方少数民族以及东南亚的群体中。Y染色体上SNP的突变率很低,利用这些稳定遗传的SNP,我们可以构建出个体或家族之间明确的遗传渊源。
高唐县汉族父系遗传组成
高唐县有两千多年的历史,悠久的历史孕育了灿烂的文化。对高唐县父系Y染色体调查对于理清其人群交流融合的历史有重要意义。本项目由复旦大学生命科学学院伦理委员会审核通过,根据知情同意的原则,我们采集了27例高唐汉族男性外周血样本进行Y染色体分型检测。
具体结果如下:
|
样本号 |
姓氏 |
单倍群 |
SNP位点 |
|
1 |
李 |
O3a3b |
O-M7 |
|
2 |
田 |
O3a3b |
O-M7 |
|
3 |
罗 |
O3a3b |
O-M7 |
|
4 |
李 |
O3a1c |
002611+ |
|
5 |
王 |
O3a1c |
002611+ |
|
6 |
唐 |
O3a1c |
002611+ |
|
7 |
任 |
O3a1c |
002611+ |
|
8 |
吴 |
O3a1c |
002611+ |
|
9 |
庞 |
O3a1c |
002611+ |
|
10 |
张 |
O3a2c1* |
O-M134 |
|
11 |
董 |
O3a2c1* |
O-M134 |
|
12 |
许 |
O3a2c1* |
O-M134 |
|
13 |
朱 |
O3a2c1a |
O-M117 |
|
14 |
李 |
O3a2c1a |
O-M117 |
|
15 |
李 |
O3a2c1a |
O-M117 |
|
16 |
李 |
N |
N-M231 |
|
17 |
梁 |
N |
N-M231 |
|
18 |
宋 |
N |
N-M231 |
|
19 |
曲 |
O1a |
O-M119 |
|
20 |
李 |
O1a |
O-M119 |
|
21 |
刘 |
O1a |
O-M119 |
|
22 |
孙 |
O3a |
O-M324 |
|
23 |
孙 |
O3a |
O-M324 |
|
24 |
赵 |
O2 |
O-M268 |
|
25 |
胡 |
O2a1a |
O-M88 |
|
26 |
郭 |
C3 |
C-M217 |
|
27 |
郝 |
D |
D-YAP |
在此次取样的27人中,我们共检测到O3a3b、O3a1c、N和C3等11种Y染色体单倍群,其频率分别占到:O3a3b、O3a2c1*、O3a2c1a、O1a和N各占11.1%, O3a1c占22.2%, O3a占7.4%, O2、O2a1a、C3和DE各占3.7%。单倍群O3a2c1*、O3a2c1a和O3a1c是汉族的主流,三者可占到全国汉族的40%以上,我们初步推测其为炎黄部族的后裔,在高唐县汉族中这三个单倍群占到45%,与全国汉族的整体遗传结构契合。比较意外的是,O3a3b-M7这种单倍群占到高唐汉族的11.1%,O3a3b-M7是苗瑶族群的特征类型,全国范围的调查发现其只占全部汉族的2%左右,且在高唐附近区县也未见O3a2b-M7高频出现,苗瑶父系成分何时又是何种原因迁徙至高唐,又是如何与当地土著相融合的值得深入研究。单倍群O1a在中国东南沿海、壮侗族群、台湾原住民分布较集中,东南亚岛屿也有广泛分布,一般认为是南方土著的父系成分,O1a在北方的高唐占到11%可能与南北汉族历史时期广泛融合相关。单倍群C是较早期到达东亚的人群,高频出现于阿尔泰语系的蒙古、满、哈萨克等族及澳大利亚土著等,汉人中通常5-10%,高唐汉族中C占到3.7%,也其在全国汉族中的比例相当。和C一样,单倍群D也是较早期到达东亚的人群,在我国西藏、日本等地占到将近一半,在汉族和南方少数民族也有较低比例分布。单倍群N是较晚期到达东亚的人群,在阿尔泰语系、芬兰人等中高频分布,在中国也广泛分布,汉人中通常10%以下。由于地理和历史原因,中国的汉族和各少数民族在遗传结构和文化方面普遍存在你中有我、我中有你的情况,使得民族群体间的关系比较复杂,高唐汉族父系遗传组成也验证了这一点。
高唐汉族姓氏与Y染色体关系
总结展望