導讀
2000年,第一個人類基因組草圖繪制完成,耗時13年,耗資38億美元。
2007年,第一個中國人基因組繪制耗時數月,耗費300萬美元。
2023年,超過400人的全基因組測序耗時僅需2.5天,單個人基因組測序成本僅不到100美元!
將單人全基因組測序成本降低至100美元甚至更低,這是基因測序行業的共同目標。
近日,華大智造(MGI)推出的DNBSEQ-T20×2(簡稱T20)平臺在真正實現這一目標*的同時,創造了全球基因測序儀單機通量的新紀錄,為基因科技的未來提供了更多可能。眾所周知,當基因測序技術成本降到一定的程度,基因測序會逐步成為推動傳統醫療向精準醫療轉變的關鍵技術。因此,T20的發布意義重大,不單單是一臺新設備的問世,更是為全球基因科技的發展和普及按下了加速鍵,加快人類對基因組學的研究,促進醫學健康領域的應用,助力實現基因科技普惠人人的宏偉目標。
測序儀被稱為基因測序產業鏈上的珍珠,其技術革新推動著人類基因組測序通量的提高和成本的下降,但技術革新從來不是一蹴而就。最初,科學家們設想能夠在一張載片上分析超過十億個擴增后的DNA片段,通過大規模并行的反應和信號檢測減少試劑耗材的消耗,降低成本。2015年,第一款基于該設想的機型,即華大智造美國子公司Complete Genomics發布的Revolocity超高通量測序儀平臺一年可完成1萬例個人全基因組測序(hWGS,human Whole Genome Sequencing)。現在,一臺T20每年可完成5萬例hWGS,成為目前世界上通量最高的低成本可量產測序儀。這背后凝聚了眾多技術的革新,《測序中國》特邀華大智造高級副總裁倪鳴博士為大家一一揭秘。
T20的“第一眼”印象
圖1:DNBSEQ-T20×2主要模塊構成。
來源:參考資料[1]
首先,我們可以直觀地了解一下T20的組成,主要包括試劑模塊、生化模塊、光學模塊(×2)、動力模塊、BIT模塊(選配)等。與大多數測序平臺的組成相比,T20并沒有太大出入,但T20打破了封閉式生化液路系統的傳統構造,采用開放式系統和模塊化結構。擁有一套這樣的設備,就相當于擁有了一座“測序工廠”。
其次,在生化原理技術路線的選擇上,T20創新性地采用了浸沒式的生化反應系統(下文將進行詳細介紹),極大地提高了測序效率和測序規模、并進一步降低了測序成本。
當前,T20可以同時支持6張超大尺寸的測序載片上機運行,每張測序載片不僅能夠獨立運行不同的測序讀長和測序應用,還能夠支持不同文庫的混合測序。T20的整個測序全流程通過2個四軸機械臂和1個六軸機器人實現了自動化串聯,單次通量是目前其他超高通量測序平臺的4.5倍~10.5倍之高(PE100,42Tb/Run;PE150,72Tb/Run)。
“將耗材成本降到極致”
生化模塊:實現T20測序成本降低的重要拼圖
T20的生化模塊采用了浸沒式生化反應技術。該技術的應用可以大大降低單位數據產出所消耗的測序試劑,提高試劑利用率,從而進一步降低單位數據測序成本。倪鳴博士感慨道:“可以說,T20正是通過浸沒式生化反應技術實現了測序讀長、測序通量、數據質量以及成本投入之間的最佳平衡。”
圖2:浸沒式(左)和流道式(右)生化平臺流程圖。
來源:華大智造
測序儀采用的流道式生化反應依賴于復雜的流體和升降溫控制系統,這種“樣本固定、試劑流動”的生化反應方案對流動槽的加工工藝有著較高的要求,包括流動槽的平整度、在升降溫過程中的形變程度、流體高精度控制等。如果固定在芯片平臺上的流動槽平整度不夠或在升降溫過程中變形過度,將直接影響生化反應的均勻性、充分性以及后續光學系統的信號采集。而復雜的流體和溫控系統也意味著較高的硬件和維修成本。此外,流道式生化反應方案中的反應試劑均為一次性使用,試劑有效成分利用率極低也限制測序耗材成本的下降。
與之相反,華大智造獨創的浸沒式生化反應采用了“試劑固定、樣本轉移”的方案,將無表面覆蓋的測序載片依次浸泡在可控溫的反應槽中以完成特定的生化反應,試劑槽溫度控制可以精密到±0.5攝氏度內,保證生化反應的穩定性。這種浸沒式的“無表面覆蓋測序載片”避免了傳統流動槽試劑流速不均勻的問題,測序載片表面不易產生氣泡,生化反應更均勻、充分,載片的利用率進一步提高,且整張浸入反應試劑中的測序載片受熱均勻,也不易發生形變等。
倪鳴博士談道:“浸沒式生化反應技術最大的優勢在于可以通過在同一反應槽依次浸泡多張測序載片,完成多個測序循環。我們采用自主研制的試劑配方,能夠在不發生交叉污染的前提下實現測序試劑的重復利用,大大提高了試劑利用率與數據生產效率,增加了數據產量,降低了測序成本。”
圖3:浸沒式(左)和流道式(右)生化反應示意圖。
來源:參考資料[2]
“將技術優勢發揮到極致”
光學模塊:支撐T20超高通量信號識別和算法輸出的核心
高質量顯微成像系統是超高通量測序儀的核心模塊。因此,T20的超高通量對光學成像、圖像識別及數據傳輸速度都提出了更高的要求。倪鳴博士表示:“采用華大智造獨有的雙色熒光測序專利技術,T20能夠高效地進行堿基識別,同時將光學硬件、計算資源大幅度壓縮,還具有減輕大數據傳輸壓力等優勢,為測序通量的增加奠定了技術基礎。”
T20光學模塊采用浸沒式光學鏡頭聯合TDI線掃相機,以支撐超高通量信號識別。據了解,T20光學模塊由光學成像模塊和光學控制模塊組成,前者負責對測序載片上的熒光信號進行成像,后者負責控制光學成像模塊、實時生成原始的堿基序列Cal.(Cal.是由華大智造測序儀堿基識別basecall軟件生成的二進制文件格式)文件。
圖4:光學模塊的光學鏡頭實物模型。
來源:參考資料[1]
倪鳴博士介紹到,為了支撐高通量信號的采集、傳輸、識別,T20的成像系統進行了多維度的創新突破。其一,其成像模塊采用浸沒式光學鏡頭,鏡頭端面直接浸沒到試劑溶液中,以試劑溶液作為拍照介質,相較空氣介質,具有數值孔徑高等特點,提高了空間分辨力,支持更高密度的測序載片運行,提高了單位面積的數據產出。此外,T20采用TDI線掃相機,相比于常規面陣式掃描方法,其搭配高性能運動平臺,光學圖像采集效率可提高2~3倍。更重要地,使用高質量的國產大視場光學物鏡,單FOV(Field of View)視場直徑超2mm,可捕獲更多的熒光信號,能夠輸出更高信噪比的熒光圖像,這為通量的提升和系統優化提供了強有力的硬件基礎。
“將算法精度提升到極致”
測序算法:匹配T20超強生產規模的數據處理和堿基識別能力
由于單位時間內捕獲到的超大量熒光信號,需要準確、快速、實時轉化成原始堿基序列信息,對獲取到的圖像的實時處理、信號轉換以及數據傳輸也提出了更高要求。為了提高數據質量,最大限度縮短數據處理時間,T20引入了硬件計算加速,突破傳統CPU架構計算能力和吞吐量的瓶頸,獲得了上百倍數據處理能力的提升。
倪鳴博士強調,針對TDI線掃成像的特點,T20研發團隊提出了非對稱的點光源亮度提取算法。隨著測序進程的推進,該算法會綜合參考過程參數進行動態調整,顯著提高了準確率,同時采用了傳統圖像處理方法和深度神經網絡相結合的方式,能夠極大地提高堿基識別算法的精度和適用性。
“將配套保障做到極致”
T20一站式工具包:助力大規模測序項目的快速啟動
進一步地,為了滿足大人群基因組項目、尤其是百萬級別國家基因組項目快速啟動的需求,以T20為中心,華大智造提供可選的一站式工具包,包括樣本制備系統(MGISTP-7000和MGISP-NE384)及試劑、自動化建庫設備(MGISP-960和 MGISP-Smart 8)、建庫試劑,以及一系列支撐海量數據處理的工具和模塊,例如:具備Pb級數據存儲和生信分析加速處理能力的ZTRON Pro一體機,以及可實現樣本管理、實驗室生產、基因數據管理的ZLIMS Pro+等。
其中,華大智造ZTRON Pro一體機是針對高通量測序儀設計的集實驗室信息管理、生信計算和海量基因數據存儲為一體的基因數據平臺,可以在實驗室中直接使用,也可部署于傳統的數據中心,滿足高達百萬級規模的測序極致交付要求。ZTRON Pro支持獨立離線部署,也支持橫向擴展,獲得了歐盟Europrise認證,符合GDPR要求,安全可靠,同時能夠最小化IT運維成本。[3]
事實上,這套一站式工具包的理念提出,是基于華大智造對測序全流程的理解與深耕。面對海量基因數據的計算、存儲及管理帶來的挑戰,華大智造提供高性價比、高密度和高擴展的技術和產品。據倪鳴博士介紹,當前,華大智造已實現測序全流程的工具布局,不僅可提供端到端“樣本到數據”的高通量自動化解決方案,而且可以提供自己的樣本前處理、文庫制備及數據分析平臺,甚至包含生物樣本庫的平臺,能夠真正解決大規模基因組學研究項目、大規模多組學研究項目等大型項目在項目過程中遇到的“工具卡點”問題。
圖5:面向大型組學項目的T20一站式工具包。
來源:參考資料[1]
結 語
通過對生化、光學、算法及配套工具等多個方面進行的極致創新及應用,T20極大地降低了測序成本,在超高通量數據輸出的同時保證了測序數據的高質量,讓人過目難忘。更加無法忽略的是,凝聚在這一超強產品背后的中國人、中國企業的自主研發創新能力。
在采訪的最后,倪鳴博士總結道:“華大智造圍繞‘存讀算用’已推出了基因測序儀、自動化產線、生物樣本庫、BIT產品等生命科技核心工具。在工具的研發上,我們始終堅持追求極致、打破邊界,希望通過最先進的技術,為全球用戶提供更多工具便利、實現更多創新突破。隨著T20的推出,華大智造測序儀產品線完成了‘低通量-中通量-高通量-超高通量’全覆蓋矩陣的進一步擴充。未來,我們的三大業務線將以此為標桿,持續為行業提供更多可選擇的權利與機會。”
華大智造DNBSEQ基因測序儀主要產品
DNBSEQ-T20×2(重點應用于大人群基因組等大型組學研究項目)
DNBSEQ-T7(重點應用于大中型測序項目)
MGISEQ-2000(重點應用于全基因組、外顯子組、轉錄組測序等)
MGISEQ-200(重點應用于小型基因組測序,靶向DNA和RNA測序,低深度全基因組測序)
DNBSEQ-G99(重點應用于靶向捕獲/多重靶向測序,小型基因組測序,甲基化測序)
DNBSEQ-E25(重點應用于病原快檢、小型基因組測序、靶向測序)
20年,將WGS測序成本從30多億美元降至100美元以內,這是一個夢想推動科技進步的時代。DNBSEQ-T20×2的誕生是測序工具領域的里程碑事件。相信DNBSEQ-T20×2提供的不止是超高通量測序的一大選擇,而是能夠激發更多 “敢實現”的科研夢想,讓更多的科研創新不再受限于測序工具的極限,為全球基因科技的發展強勢賦能,助力我們更快走進“人人基因組”時代。
*備注:DNBSEQ-T20×2可在完成5萬例人全基因組測序基礎上,將單個人全基因測序成本降低至100美元以內。
來源:測序中國
參考資料:
1.http://www.r8459.cn/products/instruments_info/44/
2.https://zhuanlan.zhihu.com/p/346771767
3.http://www.r8459.cn/products/software_info/3/