4月6日,記者從中國科學(xué)院海洋研究所獲悉,由該所張國范研究組獨(dú)立完成的論文《長牡蠣染色體水平基因組和變異圖譜構(gòu)建》近日在國際知名期刊《分子生態(tài)資源》在線發(fā)表。亓海剛副研究員為論文第一作者,李莉研究員和張國范研究員為通訊作者。
張國范介紹,該研究首次構(gòu)建了長牡蠣染色體水平基因組和貝類中第一張包含SNP、INDEL和CNV的綜合序列變異圖譜,發(fā)現(xiàn)長牡蠣基因組中存在高比例的長片段重復(fù)序列,CNV結(jié)構(gòu)變異可導(dǎo)致個(gè)體間平均21%的區(qū)域差異,更新了長牡蠣基因組資源和對基因組復(fù)雜性的認(rèn)知。
長牡蠣俗稱太平洋牡蠣,是世界重要的養(yǎng)殖貝類,具有重要的經(jīng)濟(jì)和生態(tài)價(jià)值。張國范研究組長期從事貝類養(yǎng)殖和育種相關(guān)工作,并一直致力于牡蠣基因資源挖掘和分子育種研究。2012年在Nature發(fā)表的牡蠣第一張基因組圖譜得到廣泛應(yīng)用,引領(lǐng)并開啟了水產(chǎn)物種基因組學(xué)相關(guān)研究。張國范研究組之后一直對牡蠣基因資源進(jìn)行維護(hù)和更新。隨著新一代測序技術(shù)的普及和對長牡蠣染色體水平基因組需求的增加,研究組于2019年正式啟動(dòng)長牡蠣染色體水平基因組構(gòu)建工作。
本研究利用高覆蓋第三代測序(PacBio,~200×)結(jié)合HIC技術(shù),并利用遺傳連鎖圖譜進(jìn)行輔助,對一個(gè)中國青島的長牡蠣進(jìn)行從頭組裝,獲得基因組總長度為587M,包含10條染色體水平scaffold序列,ContigN50達(dá)到3.1M,ScaffoldN50達(dá)到60M,組裝完整性和連續(xù)性均有較大提高。發(fā)現(xiàn)基因組中高比例的長片段重復(fù)在基因進(jìn)化中發(fā)揮了重要作用,同時(shí)也是導(dǎo)致之前基于二代測序技術(shù)組裝的長牡蠣基因組碎片化的主要原因。基于495個(gè)野生長牡蠣的重測序數(shù)據(jù)分析,構(gòu)建了長牡蠣綜合變異圖譜,包含480萬個(gè)高質(zhì)量SNP,60萬個(gè)INDEL和4.9萬個(gè)CNV。張國范表示,這些新的數(shù)據(jù)資源對牡蠣比較基因組學(xué)、分子育種和適應(yīng)進(jìn)化等研究具有重要意義。
美國南加州大學(xué)Dennis Hedgecock教授團(tuán)隊(duì)成員Xiaoshen Yin博士對該基因組進(jìn)行了分析,發(fā)現(xiàn)和連鎖圖譜一致性達(dá)到90%以上,明顯的組裝錯(cuò)誤不到0.1%,肯定了其較高的組裝質(zhì)量(Yin et al, 2020)。(記者 王健高 通訊員 王敏)
關(guān)鍵詞: 長牡蠣染色體水平基因組