研究人員首先從Geni.com(該網(wǎng)站為全球的合作家譜網(wǎng)站之一,用戶(hù)在Geni上分享他們的家譜)那里獲得了8600萬(wàn)條記錄(其中4300萬(wàn)有家族信息)。其使用自動(dòng)化管道刪除任何無(wú)效拓撲(例如擁有兩個(gè)以上父母的個(gè)人)。這種自動(dòng)化方法與系譜學(xué)家在關(guān)于無(wú)效拓撲的決策上擁有90%以上的一致性。數據集中的一個(gè)家譜包括1300萬(wàn)人,在創(chuàng )始人和他們的后代之間平均跨越了11代。通過(guò)評價(jià)線(xiàn)粒體DNA (母系傳遞)和Y染色體短串聯(lián)重復序列(父系傳遞)等單系標記的遺傳分離模式,也證實(shí)了家譜質(zhì)量的真實(shí)。
接下來(lái),作者從在線(xiàn)檔案中提取人口統計數據(包括出生和死亡日期以及個(gè)人的地理位置)。通過(guò)關(guān)聯(lián)相關(guān)歷史事件(例如,重要戰爭中死亡率上升),對平均壽命與歷史數據進(jìn)行密切匹配,分析并證實(shí)人口出生和死亡期,進(jìn)一步得出主要城市中個(gè)人的首次歷史出現與其建立日期相一致,從而確定了位置數據的準確性。
作者還創(chuàng )建了一個(gè)模型來(lái)檢測遺傳變異(包括可加性,優(yōu)勢,上位性等)對長(cháng)壽的影響,該模型表現出了使用全基因組關(guān)聯(lián)研究難以解剖的復雜遺傳學(xué)。對300萬(wàn)對親屬壽命的分析揭示遺傳成分具有顯著(zhù)的加性(約16%),顯性貢獻率較低(2~4%),沒(méi)有檢測到上位性,(表明基因對長(cháng)壽的作用可能比科學(xué)家們想象的?。?。這些新數據中的加性遺傳因素低于先前的估計值(約25%),表明致力于從基因組數據中檢測致病基因的遺傳變異以尋求長(cháng)壽基因可能比預期的更困難。
此外,作者使用他們的數據集來(lái)分析人類(lèi)遷徙模式時(shí),發(fā)現西方社會(huì )中的女性移民比男性多,盡管都是短距離遷移。因此,作者推測,大規模的跨國移民活動(dòng)可能更多的涉及男性而不是女性。
作者通過(guò)分析婚姻半徑(配偶出生地之間的距離)—隨著(zhù)它的增加,根據“隔離距離”理論可預測會(huì )導致夫妻遺傳相關(guān)性降低。在當時(shí)主要的社會(huì )政治事件中,平均婚姻半徑也如預期的那樣發(fā)生了變化,例如在1750年和1870年工業(yè)革命出現后婚姻半徑增長(cháng)。有趣的是,在1800年之后,婚姻半徑的增加和夫妻的基因相關(guān)性下降之間存在50年的延遲,在此期間,盡管距離越來(lái)越遠,但是個(gè)人繼續與親戚結婚。作者將這種現象歸因于文化規范的改變,(而不是19世紀早期遠程交通的出現)。
這項研究證明了研究人員和公眾之間(通過(guò)在線(xiàn)數據庫)合作的有效性。在將基因組測序數據覆蓋到這些譜系上之后,用這種方法建立的龐大家系將有助于對遺傳學(xué)和公共健康方面的定量評估。
參考資料:
Human genetics: Population-scale family trees from publicly available data
合作咨詢(xún)
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com