用DNA研究人类的起源、迁徙和民族融合等的学问,在学术界被称为分子人类学。通过检测一个人的父系Y染色体,可以了解自己祖源甚至迁徙路线。本文就大概介绍一下各省的父系Y染色体的比例状况。为了让大家能够看懂这些统计数据,本文首先对一些常识做介绍。
父系Y染色体,被分为了从A到Z等20多种。其中A、B、E三种为非洲基因,而其他都是走出非洲的基因。C、D比较早走出非洲的基因,其中C为棕色人种的基因,曾经广泛分布于东亚大陆,是中国游牧民族的基础基因之一;D为小矮黑人基因,曾经也大量分布于南亚、东南亚、中国西南地区等,现在主要分布在高寒、偏远地区。F、G、H、I、J、K、L、M、P、Q、R为白种人基因,主要分布在亚欧大陆的西部。N、O为黄种人基因,N基因主要分布在西伯利亚,是今天因纽特人的主要基因,在游牧民族中有较大的比例,O是东亚、东南亚黄种人的主流基因。
中国的所有民族中,O1,O2,C,D的比例是比较多的。其中O1主要是东南亚人基因,在中国岭南地区的民族中有较高的比例;O2是汉族的主流基因,在5000年前的龙山文化中,O2比例超过了90%,现代汉族的O2比例也达到了60%左右。除了汉族,其他很多民族的主体也是O2,如独龙族、羌族等。
本文的数据主要来源于23魔方基因,是抽样调查的数据,在精确性方面是肯定有不足的地方,但是也能够在大体上说明问题。而本文所列出的省份有20多个,个别省区没有找到数据。本文主要就按照地区,将全国分为几个区域进行总体的分析。
首先,来分析东南地区吧。古代的东南地区是百越族活动的地区,如扬越、东瓯、闽越、南越、西瓯、骆越、句吴、于越等,《汉书·地理志》记载百越的分布“自交趾至会稽七八千里,百越杂处,各有种姓”,也就是分布从越南北部一带一直到苏浙一带。春秋时期,其中的于越建立了越国,曾经称霸中原,成为“春秋五霸”之一。
秦汉之后,大量的中原人南迁,不断和百越民族融合。到近代以来,广东、福建、江苏、浙江、安徽、浙江等境内的百越民族都基本融入了汉族之中。从基因比例来看,这些地区的O1基因非常的高,低的达到了四分之一,高的占据三分之一。说明该地区的民族融合是比较普遍的。
还未融入汉族的百越民族主要是壮侗语族,主要有壮、布依、傣、侗、水、仫佬、毛南、拉珈、黎、仡佬民族,主要分布在西江流域的广西和贵州。其中广西是典型的代表,广西的O1高达43%。
云贵地区,是中国少数民族最多的地方。由于民族成分十分复杂,单独看总体的基因分布难以看出什么端倪。值得注意的是,云贵地区是古代人类进入中国的第一站。因为该地区自然地理比较封闭,因而能够保存很多比较古老的民族,如独龙族、怒族、水族、纳西族、景颇族等,这些民族的基因是非常纯的,如独龙族的O2超过了90%。
陕西省、河南、河北、山东、山西一带是中华文化的发祥地之一,同时也是古代中国民族融合最频繁的地区之一。历史上有羌族、戎狄、匈奴、鲜卑、契丹、蒙古、女真等游牧民族不断进入中原,逐渐融合到了汉族之中。黄河流域各省的C基本维持在10%,这部分基本上就是从草原带来的基因。按照庞大的基数计算,这部分的人口数量还是很大的。
湖北、湖南处于古代的荆楚大地,处于南北方交流的地带。该地区的O1基因也非常高,在30%左右。该地区至今也有苗、瑶、土家等民族,数量还是非常庞大的。
内蒙古地区,古代叫做漠南,是农耕民族和游牧民族的过渡地区。内蒙古地区比较注意的是C的比例很高,C1和C2的总和达到了16%,或许是各省区中最高的。内蒙古的主要少数民族是蒙古族,根据DNA测量,蒙古族的C比例高达53%。
当然,以上只是一个大概的情况,还有许多N、D、R等没有分析,他们虽然占据的比例很小,但是在历史上都非常重要。根据23基因魔方的分析,中国97.6%的人都是混血人,意思是民族融合几乎发生在每一个人的身上。
推荐阅读
从语言和基因角度说中国各民族起源,许多民族都是同宗同源
元谋人等是中国人的祖先吗?DNA检测结果证明他们早已灭绝
人类起源于非洲是如何论证的?DNA检测的数据称为不可推翻的依据
从DNA角度看中华民族的形成:中华大地的民族基本都是血脉相连的
匈奴人是黄种人还是白种人?DNA检测分析显示其成分十分复杂