人類基因組和其測(cè)序與分析方法介紹
吳偉農(nóng)
人類基因存在于人體每一個(gè)細(xì)胞內(nèi)的脫氧核糖核酸分子即DNA分子內(nèi)。DNA分子在細(xì)胞核內(nèi)的染色體上由兩條相互盤繞的堿基鏈組成。經(jīng)初步測(cè)定,人類基因組共有31.6億個(gè)堿基對(duì),人類基因組計(jì)劃就是測(cè)試出人類23對(duì)染色體上堿基的排列順序。這項(xiàng)耗資30億美元的計(jì)劃于1990年由美國(guó)國(guó)家衛(wèi)生研究機(jī)構(gòu)發(fā)起,包括中國(guó)在內(nèi)的多個(gè)國(guó)家的科學(xué)家參與了這一研究,中國(guó)承擔(dān)了1%的工作量,并于去年5月圓滿完成。
在人類基因組探索過(guò)程中,人類基因組工程的科學(xué)家和美國(guó)塞萊拉公司的科學(xué)家采用了兩種不同的測(cè)序和分析的方法。塞萊拉公司的核心分析方法被稱為“霰彈法”,人類基因組工程則采用了“克隆法”。
塞萊拉公司研究組包括282位來(lái)自美國(guó)、歐洲、澳大利亞、以色列和西班牙的研究機(jī)構(gòu)的人員,他們代表了12個(gè)不同的學(xué)術(shù)機(jī)構(gòu)、非盈利機(jī)構(gòu)和商業(yè)性組織?茖W(xué)家們從3女2男5位志愿者體內(nèi)提取了DNA樣品,他們包括1名非洲裔美國(guó)人,1名亞裔、1名拉美裔和兩名白人。
霰彈法是一個(gè)高度計(jì)算機(jī)化的方法,它是先把基因組隨機(jī)分成已知長(zhǎng)度(2000個(gè)堿基對(duì)、1萬(wàn)個(gè)堿基對(duì)、5萬(wàn)個(gè)堿基對(duì))的片段,然后用數(shù)學(xué)算法將這些片段組裝成毗鄰的大段并確定它們?cè)诨蚪M上的正確位置。
由公共經(jīng)費(fèi)支持的人類基因組工程則采用另一種方法,即先復(fù)制更大段的人類基因序列,然后將它們繪制到基因組的適當(dāng)區(qū)域,這種方法需要研究人員在早期把較多的時(shí)間和精力放到克隆和繪制草圖上,而塞萊拉公司的方法是在后期需要做大量的計(jì)算工作。塞萊拉公司的科學(xué)家先用霰彈法測(cè)序DNA,并將整個(gè)基因組覆蓋8次,然后用兩個(gè)數(shù)學(xué)公式將人類基因組序列多次組裝起來(lái),確定出了基因中的轉(zhuǎn)錄單元,預(yù)測(cè)出了60%的已識(shí)別基因的分子功能。最后研究人員將人類基因組信息與此前已完成的果蠅和線蟲(chóng)的基因組序列進(jìn)行比較,從而找出了三者共有的核心功能。
兩個(gè)研究組將數(shù)據(jù)進(jìn)行的對(duì)比以及人類基因組工程的科學(xué)家、《科學(xué)》和《自然》雜志高級(jí)指導(dǎo)編輯的評(píng)估表明,塞萊拉公司的基因組分析與人類基因組工程的分析結(jié)果雖然存在一些差異,但大部分地方都有極高的吻合度。塞萊拉公司測(cè)定的序列覆蓋了95%以上的人類基因組,其中約85%的人類基因組存在于按照正確順序排列、至少包含50萬(wàn)個(gè)堿基對(duì)的片段中。這一序列為人類至少擁有2.6383萬(wàn)個(gè)控制合成蛋白質(zhì)的基因提供了有力的證據(jù),也為另外1.2731萬(wàn)個(gè)假設(shè)基因的存在提供了較弱的證據(jù)。
北京晨報(bào), http://www.www.srpcoatings.com
人類基因存在于人體每一個(gè)細(xì)胞內(nèi)的脫氧核糖核酸分子即DNA分子內(nèi)。DNA分子在細(xì)胞核內(nèi)的染色體上由兩條相互盤繞的堿基鏈組成。經(jīng)初步測(cè)定,人類基因組共有31.6億個(gè)堿基對(duì),人類基因組計(jì)劃就是測(cè)試出人類23對(duì)染色體上堿基的排列順序。這項(xiàng)耗資30億美元的計(jì)劃于1990年由美國(guó)國(guó)家衛(wèi)生研究機(jī)構(gòu)發(fā)起,包括中國(guó)在內(nèi)的多個(gè)國(guó)家的科學(xué)家參與了這一研究,中國(guó)承擔(dān)了1%的工作量,并于去年5月圓滿完成。
在人類基因組探索過(guò)程中,人類基因組工程的科學(xué)家和美國(guó)塞萊拉公司的科學(xué)家采用了兩種不同的測(cè)序和分析的方法。塞萊拉公司的核心分析方法被稱為“霰彈法”,人類基因組工程則采用了“克隆法”。
塞萊拉公司研究組包括282位來(lái)自美國(guó)、歐洲、澳大利亞、以色列和西班牙的研究機(jī)構(gòu)的人員,他們代表了12個(gè)不同的學(xué)術(shù)機(jī)構(gòu)、非盈利機(jī)構(gòu)和商業(yè)性組織?茖W(xué)家們從3女2男5位志愿者體內(nèi)提取了DNA樣品,他們包括1名非洲裔美國(guó)人,1名亞裔、1名拉美裔和兩名白人。
霰彈法是一個(gè)高度計(jì)算機(jī)化的方法,它是先把基因組隨機(jī)分成已知長(zhǎng)度(2000個(gè)堿基對(duì)、1萬(wàn)個(gè)堿基對(duì)、5萬(wàn)個(gè)堿基對(duì))的片段,然后用數(shù)學(xué)算法將這些片段組裝成毗鄰的大段并確定它們?cè)诨蚪M上的正確位置。
由公共經(jīng)費(fèi)支持的人類基因組工程則采用另一種方法,即先復(fù)制更大段的人類基因序列,然后將它們繪制到基因組的適當(dāng)區(qū)域,這種方法需要研究人員在早期把較多的時(shí)間和精力放到克隆和繪制草圖上,而塞萊拉公司的方法是在后期需要做大量的計(jì)算工作。塞萊拉公司的科學(xué)家先用霰彈法測(cè)序DNA,并將整個(gè)基因組覆蓋8次,然后用兩個(gè)數(shù)學(xué)公式將人類基因組序列多次組裝起來(lái),確定出了基因中的轉(zhuǎn)錄單元,預(yù)測(cè)出了60%的已識(shí)別基因的分子功能。最后研究人員將人類基因組信息與此前已完成的果蠅和線蟲(chóng)的基因組序列進(jìn)行比較,從而找出了三者共有的核心功能。
兩個(gè)研究組將數(shù)據(jù)進(jìn)行的對(duì)比以及人類基因組工程的科學(xué)家、《科學(xué)》和《自然》雜志高級(jí)指導(dǎo)編輯的評(píng)估表明,塞萊拉公司的基因組分析與人類基因組工程的分析結(jié)果雖然存在一些差異,但大部分地方都有極高的吻合度。塞萊拉公司測(cè)定的序列覆蓋了95%以上的人類基因組,其中約85%的人類基因組存在于按照正確順序排列、至少包含50萬(wàn)個(gè)堿基對(duì)的片段中。這一序列為人類至少擁有2.6383萬(wàn)個(gè)控制合成蛋白質(zhì)的基因提供了有力的證據(jù),也為另外1.2731萬(wàn)個(gè)假設(shè)基因的存在提供了較弱的證據(jù)。
北京晨報(bào), http://www.www.srpcoatings.com
百拇醫(yī)藥網(wǎng) http://www.www.srpcoatings.com/Html/Info/News/372/37278.htm