從組織抗原推論閩南人及客家人,所謂「台灣人」的來源
林媽利 (馬偕紀念醫院輸血醫學研究室)

  摘要台灣的閩南人及客家人也就是所謂的「台灣人」(以下均以括弧的「台灣人」代表閩南人及客家人),是近幾世紀以來自中國大陸東南沿海地區移民的後代,在基因上經族群系統發生樹( phylogenetic tree )及族群相關分析( correspondence analysis ) 研究計算後,發現閩南人及客家人是屬於南亞洲人種,這剛好配合民族史的記載,認為「台灣人」是大陸東南沿海原住民「越族」的後代。A33-B58-DRB1*03 ( 即A33-Cw10-B58-DRB1*03-DQB1*02 )是「台灣人」最常見的組織抗原(HLA)半套體,頻率為6.3%,而這半套體在新加坡華人及泰國華人也算是最常見,顯示這是被完整保留下來的古代越族的基因。

  前言「台灣人」是台灣島上最大的族群,袓先是近400年從大陸東南沿海地區移民過來的。先民到達台灣後,不少和原住民通婚,主要是和平地的平埔族,也有和高山原住民。在我們以前的研究發現「台灣人」13%的基因( HLA-A,B,C半套體 )是來自原住民,在那個研究我們是做了九族高山原住民及在消失中的「巴宰」平埔族的研究,這雖然顯示「台灣人」的基因中並沒有像想像中的有許多原住民的基因,但因為昔日的九族平埔族現在已不易找到,無從研究及比較,所以到底有多少現在「台灣人」的基因是來自這些已經消失的平埔族是不得而知的(參考文獻1)。但是另一方面「台灣人」經口述或從族譜代代相傳,自認「台灣人」的祖先是來自中國北方的中原,在漢朝及以後的幾百年當中為了逃避北方匈奴的侵略而南遷到中國大陸東南沿海地區,所以「台灣人」應該算是北方中原漢人的純種後代,所以屬於偉大的漢人傳統「華夏」。在這研究中我們分析閩南人及客家人的HLA(為組織抗原的簡稱)資料,建構族群系統發生樹、畫製族群的相關分析圖、追蹤及比對在閩南人客家人最常見的HLA半套體在別族群出現的情形,借此希望澄清有關「台灣人」的來源。

  材料及方法我們研究在馬偕醫院做家族血緣關係的123個家族,當中共有167人為互相無血緣關係的「台灣人」,其中136人有閩南人的雙親,24人有客家人的雙親,及7個人各有一個閩南人及客家人的父母。

血液檢體經血清學的方法利用Terasaki Chinese HLA-A,B,C 72洞的測定盤及後來的Terasaki單株抗體亞洲HLA class I測定盤,以測定HLA型別。所有的檢體也都經我們發展出來的「台灣HLA class I測定盤」測試。HLA-class II DNA的測定是用中等解析度的One Lamda Micro SSP Generic HLA class II DNA測定盤做的。 我們也檢測取自75個互相無血緣關係客家人的血液檢體(32人取自屏東縣萬巒鄉及內埔鄉,43人取自新竹縣新埔鎮),這些人的父母親都是客家人。我們將這75個檢體當成panel細胞參加1998年日本紅十字會中心區組織配合研討會,所以這些細胞和日本、韓國、泰國、美國、非洲及台灣等參加的實驗室收集到的420個抗血清反應,而測定出HLA class I的分型。這75人也做HLA class II的DNA測定。 136個閩南人及99個客家人 ( 24+75 ) 的HLA-A, B, C, DRB1及DQB1基因頻率是根據第11屆國際組織抗原研討會(11th IHW)發展出來的最大的可能性法 ( maximum likelihood method ) 計算得到(參考文獻2)。至於A-Cw-B, A-B-DRB1及A-Cw-B-DRB1-DQB1半套體的頻率是經由直接計算血緣鑑定個案的半套體數得到。族群間基因距離的遠近D (1972年 Nei的標準基因距離,參考文獻3)及DA (1983年Nei設計,參考文獻4)的計算是依據本報告的頻率與11th IHW許多別族群HLA-A,B,C基因頻率的報告(見參考文獻5)的比較,再經 “ODEN”計算(一個開放使用的電腦軟體)。我們研究的族群標明在圖1,計算出的基因距離D經鄰近連接法( neighbor-joining method,參考文獻6 ) 建構的族群系統發生樹如圖2。根據許多族群不同的HLA-A,B,C基因頻率,經Vista ( 一個開放使用的電腦軟體,http://forrest.psych.unc.edu )畫製出來的族群相關分析圖如圖3,這報告研究的族群包含本報告的閩南人、客家人及11th IHW的許多族群。

  結果136個閩南人及99個客家人HLA-A, B, C, DRB1及DQB1的基因頻率如表1,可見到A2及B27的基因頻率在這兩族群間有明顯的差別(P < 0.05),這很可能是由於我們個案數不夠引起的,因為在另一多個案數的研究報告中並沒有這個差別(參考文獻7)。客家人Cw8基因頻率較高而CBL較低,可能是因為客家人的檢體大部份由420個HLA抗血清測定而得到的結果,因為一般的測定盤較不易測到Cw8而變成CBL。A2, A1101, B60, B46, B58, B13, Cw10, Cw7, Cw1, DRB1*04, DRB1*09, DQB1*06, DQB1*0301及DQB1*05在這兩個族群中有高的基因頻率。分析「台灣人」HLA半套體A-Cw-B, A-B-DR及A-Cw-B-DR-DQ在我們研究的家族中出現的情形,結果發現A-Cw-B 3個基因位半套體有在這些「台灣人」家族中共出現126不同的組合,A-B-DR有212組,A-Cw-B-DR-DQ有247組。只有A-Cw-B 3個基因位的半套體在這些家族出現的數目超過6次的才顯示於表2,而A-Cw-B-DR-DQ 5個基因位的半套體數出現超過4次的顯示於表3。從表2可見5個最常見A-Cw-B 3個基因位的半套體是A33-Cw10-B58 (10.8%),A2-Cw1-B46 (7.8%),A1101-Cw7-B60 (5.7%),A1101-Cw10-B13 (3.9%)及A1101-Cw1-B46 (3.2%),而5個最常見的A-B-DR 3個基因位的半套體是A33-B58-DRB1*03 (6.3%),A2-B46-DRB1*09 (3.0%),A33-B58-DRB1*13 (3.0%),A1101-B13-DRB1*15 (1.8%)及A1101-B75-DRB1*12 (1.8%)。表3顯示在「台灣人」3個最常見的A-Cw-B-DR-DQ 5個基因位的半套體是A33-Cw10-B58-DRB1*03-DQB1*02 (6.3%),A33-Cw10-B58-DRB1*13-DQB1*06 (3%) 及A2-Cw1-B46-DRB1*09-DQB1*0303 (2.7%)。從計算得到基因距離的D所建構的族群系統發生樹如圖2,可以看到閩南人及客家人先合併在一起(顯示為基因最接近及最相似的2個族群),然為後再和泰國華人及新加坡華人接連起來,成一個發生樹的一枝,這一枝和旁邊的由泰國人、越南人、布依族人形成的一枝及由南方漢人及苗族所成的一枝連起來而成南亞洲族群枝。黎族成一獨立的一枝,而北方漢人與北亞洲族群的回族、滿族、蒙古人、Buriat人、Uygur人、哥薩克人、韓國人、日本人及鄂倫春人在一起。我們用DA建構的族群系統發生樹也是將南亞洲及北亞洲族群分開。 以基因頻率計算及繪製的有關閩南人、客家人及許多亞洲族群的族群相對分析圖,點畫出的關係如圖3,同樣顯示閩南人、客家人與其他南方的亞洲族群包括南方漢人、新加坡華人及泰國華人靠近而成一群。北方漢人和韓國人、滿族及回族成一群。台灣原住民和新幾內亞高地人成另一群。

  討論因為HLA是多變異及多樣化的基因系統,所以是研究族群關係很好的材料,HLA在不同族群間所顯示的差異比別的基因系統還要明顯,且利用HLA的半套體研究時差異更顯著,所以是一個很好的研究族群關係的指標。許多半套體由特定的HLA基因構成而經過幾千年許多世代的傳嫡而不改變,而且每個特定的半套體的分佈有其地域的限制。所以HLA半套體在探討相近族群間的關係時是強而有力的基因標誌 (參考資料8)。利用家族的分析是研究多個基因位上HLA半套體的分佈情形最好的方法,雖然過去有幾個有關台灣HLA半套體分佈的研究,都是經統計計算得到的,我們的報告是第一個用家族的分析得到「台灣人」HLA半套體分佈的情形而加以研究的。 A33-B58-DRB1*03是「台灣人」最常見A-B-DR 3個基因位的半套體(6.3%),且完整的經過千年被保存下來,其相對的五個基因位半套體是同頻率的A33-Cw10-B58-DRB1*03-DQB1*02 (6.3%)。慈濟台灣骨髓登錄也和我們有相似的結果(參考文獻7),他們經計算也發現A33-B58-DR17( 即DRB1*03 )半套體是「台灣人」最常見的半套體,佔閩南人7137人中5.5%,及客家人714人中5.10%。A33-B58-DRB1*03半套體也在東南亞(泰國華人7.1%,新加坡華人4.4%,參考文獻5)及北方亞洲人發現(在烏魯木齊的漢人3.5%,蒙古的Khalha族3.4%、烏魯木齊的Uygur 1.8%、哥薩克人 1.8%、韓國人1.2%,參考文獻9、10),而同樣的5個基因位的半套體在泰人可以看到(泰國人2.2%,Black Thai 2.8% ,參考文獻11)。另一有趣的所見是HLA-A,B 2個基因位的半套體A33-B58在南方漢人(檢驗人數為138人,取自湖南及福建2省,參考文獻5)只有2.4%,如再加上檢測DR基因位而成A-B-DR半套體時,因所得數目太小在11th IHW變成無意義的數目。另一方面較早期的報告A33-B17( B58是屬於B17 )的半套體在南方漢人的頻率(檢驗844人)是1.53%而南方少數民族(檢驗621人)的頻率為1.29%(參考文獻12)。在另一個報告,A33-Cw10-B58在北方漢人發現(檢驗196人)為3.1% (參考文獻13),但這跟隨的DR基因在東北亞洲人應該是DR13而不是在「台灣人」的DR3,所以B58-DR3半套體的分佈是明顯的集中在東南亞的族群(參考文獻8)。A33-Cw10-B58-DRB1*03-DQB1*02的3或5個基因位的半套體雖然可在東亞或東南亞看到,但最高的頻率是在「台灣人」、新加坡華人及泰國華人,而這三個族群的祖先都是在近幾百年才從大陸東南沿海移民出去的,因此這半套體可以說是這三個族群一直保存下來的遺傳標誌。

「台灣人」第二個常見的3個基因位的半套體在我們的研究是A2-B46-DRB1*09 (3.0%),根據文獻也在別的族群發現,包括新加坡華人(7.7%)、越南人(5.2%)、南方漢人(5.1%)、泰國人(4.7%)及泰國華人(2.4%),而相對的5個基因位的半套體A2-Cw1-B46-DRB1*09-DQB1*0303 (2.7%)也在Black Thai (8.3%),Dai Lui(泰北的傣族5.1%) 及泰國人(2.1%) 看到,顯示為亞洲南方族群的半套體(參考文獻5、8、11)。 就單單從許多HLA研究的結果,長久以來即已經知道北方漢人及南方漢人在基因上不同(參考文獻7、8、14、15),這和發現的中國史前資料及有文字記載以後的歷史相配合。「中原文化」是在中國北方黃河的黃土高原發展出來的,從最近挖掘出來的粟米(millets)可以追朔到公元前6到7千年之久。中原文化在夏、商、周時期是在長江以北,直到秦朝(公元前221-206年)後政治的勢力才及於中國大陸的中南方(參考文獻17)。最近的考古研究發現在中國大陸南方,在同一個時候存在另一個獨立且不同於中原文化的「越沿海文化」,從長江三角洲到越南北方的紅河三角洲(參考文獻18)。但是南方的歷史只從公元前500年左右吳越相爭之前才開始有的,越王勾踐的「臥薪嚐膽」復國的故事是大家所熟悉的。「越族」是指大陸東南沿海( 浙江、福建、廣東及廣西 )的居民,在漢朝以前因為這地區文化的多樣性而被稱為「百越」。除了春秋戰國的吳越相爭及在漢朝時期部份越族的北移外,在中國的歷史(即中原文化的歷史)並沒有太多有關越族的記載,因為在中國的歷史除了中原文化外,其他族群均屬「蠻族」(參考文獻17、19)。閩人及台灣閩南人的祖先是居住在福建的越族,根據林惠祥(參考文獻17)及Meacham的研究(參考文獻19),今日的閩人是東南沿海地區原住民「越族」的後代,雖然在秦漢及接下來的魏晉南北朝五胡亂華時期,因為戰亂北方中原人士紛紛南遷,而可能引起部份有限的中原基因的滲入。當「越」的文化漸漸被「漢」化後,「越族」就在歷史上被改名成「漢族」,導至今日台灣的閩南人錯誤的判斷且自認為是純種北方漢族的後代。在中國歷史上許多民族接受漢文化而漢化,後來這些人民也常常宣稱他們是漢族,這是因為在過去漢文化是強勢文化,所以當了漢人可得到利益及社會地位(參考文獻17、19、20)。在客家人的情形也是相似,在南宋(1127-1279AD)或更早的時期有少數的中原家族南遷到東南沿海的山區,這些人以強勢的漢文化在文化及語言上影響周遭的原住民,特別是住在廣東的越族,所以以早期的少數中原移民加上眾多的越族而成客家族群(參考文獻21)。

我們以統計得到基因距離D及DA建構的族群系統發生樹,顯示閩南人與客家人有相當一致的基因,所以先合在一起,然後再和泰國華人、新加坡華人合併成一枝,而這些族群都是起緣於東南沿岸的原住民「越族」,其中最重要的是「台灣人」明顯的和北方漢人分開。慈濟骨髓登錄的資料建構的族群系統發生樹顯示「台灣人」和南方漢人合併,但和北方漢人分開(參考文獻8)。其他許多HLA的研究,及別的基因和遺傳標誌,像免疫球蛋白(參考文獻22)、血型(參考文獻23)、葡萄糖六磷酸去氫酵素(參考文獻24)及染色體DNA微衛星(參考文獻25)等,都明顯的把「台灣人」和北方漢人分開。不久前中國北京的中科院遺傳研究所和美國史坦福大學Cavalli-Sforza合作研究,以中國人的姓氏及三種簡單的血型分佈情形將北方漢人與南方漢人分開(參考文獻20),在該項研究中南方漢人再被分為3群,即長江下游以上海為中心的一群、長江流域的一群及另一群屬於越族的東南沿海地區及島嶼(包括台灣)的居民。中國人的姓氏約有4000年的歷史而且是由男性傳承,所以可以認為代表Y染色體的遺傳,該研究更借著中國的28省加上台灣以ABO、MN及Rh(D) 血型的基因頻率而計算出族群的關係,畫製成的第一度及第二度空間上的族群主要相關圖明顯的把東南沿海地區及台灣的居民(即越族)與其他地區的居民分開。

以上資料顯示南方漢人是緣自南方而有別於北方漢人,「台灣人」是古代越族的後代而保存著古代越族的基因A33-Cw10-B58-DRB1*03-DQB1*02。有關「台灣人」與南方漢人的基因距離的遠近,有待將來的研究,因為現在這研究中所用的南方漢人資料有一半是自福建(參考文獻5)。

  感謝國家衛生研究院(DOH87-HR-601)的支持,在此致謝。