【儀器網(wǎng) 生物醫(yī)藥】隨著DNA測序技術(shù)開始大規(guī)模商業(yè)化應用,我們已經(jīng)可以很容易地得到自己的全基因組測序結(jié)果。雖然三代測序技術(shù)只需要短短一天就可以完成一個人的全基因組測序,但即使是現(xiàn)在,基因組的測序與分析依然是繁重復雜的工作。1990年人類基因組計劃提出后,多個國家分工合作,歷史14年才完成人類的基因組測序,這足以說明測序過程需要的龐大工作量。測序時間的縮短不僅得益于測序技術(shù)的發(fā)展,還需要感謝計算機技術(shù)日新月異帶來的數(shù)據(jù)處理能力的飛速發(fā)展。
近日,中國農(nóng)業(yè)科學院深圳農(nóng)業(yè)基因組研究所阮玨團隊開發(fā)出了基于第三代DNA測序技術(shù)的算法Wtdbg。這是2016年Wtdbg算法初步研究成功后的升級版本,分析速度與今年4月發(fā)布的Flye算法相比提升了5倍,并且突破了測序分析時間長于測序數(shù)據(jù)產(chǎn)出時間的瓶頸,大大提高了第三代測序數(shù)據(jù)的分析效率。據(jù)了解,更高的版本在今年初就已經(jīng)進入研究階段。
目前,市場上商用的DNA測序技術(shù)仍然以第二代高通量測序(NGS)為主,主要原因是在早期第三代測序技術(shù)的成本要高很多,以及第三代測序技術(shù)錯誤率高,而且因為測序原理不同,基于第二代測序技術(shù)的基因組裝方法無法配適,組裝缺少效率。阮玨團隊在第二代測序組裝分析理論德布魯因圖的基礎(chǔ)上提出了模糊布魯因圖,將測序數(shù)據(jù)切分為固定長度的短串,再利用短串恢復出全基因組序列。同時通過重新定義“短串”,研究團隊使模糊布魯因圖具有了高效率和高容錯的優(yōu)點。
2016年Wtdbg算法研發(fā)成功后就成為國內(nèi)多家基因測序企業(yè)主要的組裝分析工具。雖然不是測序方法的進步,但算法的突破對基因測序技術(shù)的影響也很大。現(xiàn)階段,生物醫(yī)學研究的發(fā)展趨勢是以全基因組組裝方式對群體進行測序分析,而Wtdbg算法的發(fā)展讓這一目標成為現(xiàn)實。
數(shù)據(jù)處理系統(tǒng)幾乎是所有先進儀器的核心系統(tǒng)之一。不管是
光譜、
質(zhì)譜、
色譜等分析儀器還是電子顯微鏡等光學儀器在獲取數(shù)據(jù)之后都需要通過數(shù)據(jù)處理軟件分析數(shù)據(jù)得出檢測結(jié)果。而數(shù)據(jù)處理系統(tǒng)的核心就是算法,其中除了分析數(shù)據(jù)的算法之外還包括減少誤差、修正硬件特性的算法等。算法的進步可以提高儀器的數(shù)據(jù)處理能力,讓儀器的檢測結(jié)果更精確,減少檢測結(jié)果的誤差,還可以提高儀器的檢測速度。
隨著大數(shù)據(jù)時代的到來,儀器將越來越智能化和數(shù)字化,這一進程需要依靠大量的算法支撐。不僅分析儀器的檢測數(shù)據(jù)需要算法分析,數(shù)據(jù)的儲存、傳輸、對比也需要算法處理。甚至當實驗室通過互聯(lián)網(wǎng)技術(shù)形成一個整體,儀器與儀器之間的互動,人與數(shù)據(jù)化實驗室的互動都是算法大展拳腳的舞臺。
資料來源:新華網(wǎng)
昵稱 驗證碼 請輸入正確驗證碼
所有評論僅代表網(wǎng)友意見,與本站立場無關(guān)