圖1. 華大智造發布MGIEasy stLFR文庫制備試劑盒
2018年10月25日,第十三屆國際基因組學大會(簡稱“ICG-13”)在深圳隆重召開。華大智造同期舉行“基因組學技術與應用研討會”,并在會上發布MGIEasy stLFR文庫制備試劑盒。MGIEasy stLFR文庫構建試劑盒是世界范圍內首款基于無分隔共標記方法的長片段讀取試劑盒,該試劑盒利用高精度短讀序列獲得長距離信息,融匯二代三代測序技術之長,被譽為“完美的WGS建庫”。
該技術于2018年3月在國際人類基因組大會(Human Genome Meeting,簡稱HGM)正式發布,今年10月成功轉化為試劑盒產品并發布。基于華大智造專利的DNA分子共標簽技術,即將來源于同一DNA長片段的短讀測序片段標記上相同分子標簽,stLFR實現了基于高精度短讀測序獲取長片段DNA信息 (圖2)。與華大智造世界領先的DNBseq?測序技術相結合,stLFR技術能夠實現高質量變異檢測,二倍體基因組定相,結構變異解析及其他長讀長應用。
為了讓用戶第一時間體驗該技術,華大智造招募首批試用客戶(可掃描文末二維碼申請)。相比傳統WGS文庫和其他同類產品,stLFR文庫僅需1 ng DNA且無需預擴增即可獲得高質量的全基因組測序文庫;二倍體定相區塊N50值可達10 Mb,有效檢出倒位、異位、刪除等結構變異;單管無分隔反應,無需微量移液設備或復雜微流控系統;全部反應在磁珠上完成,易于高通量自動化建庫。
圖2. stLFR技術原理示意圖。該技術從提取好的長片段DNA起始,將轉座子序列隨機插入至長片段DNA中,利用DNA雙鏈互補原理將該產物與帶有多拷貝分子標簽的磁珠載體結合,在引入第二個接頭后進行PCR擴增,最終完成文庫構建。
stLFR -數據表現
長片段讀取
利用DNA共標記方法,MGIEasy stLFR試劑盒可以檢測分析DNA分子長度平均長度可達50-70 Kb,最大值可超過300 kb(圖3A)注1。不僅如此,得益于stLFR文庫超高的分子標簽數,超過85%的標簽內有且僅有一個DNA長分子(圖3B)注2,這賦予了stLFR文庫一些可以媲美單分子測序的數據特性。
注1:該數據表現決定于初始DNA提取長度。
注2:該數據表現決定于初始DNA投入量和DNA提取長度。
圖3. stLFR 長片段讀取特征。(A)片段長度分布。stLFR文庫可以檢測的DNA分子長度典型值一般為50 Kb左右,最長可達300 Kb。(B)每個標簽內的長片段數量分布。從1 ng DNA起始構建stLFR文庫時,約有85% 標簽內有且僅有一個DNA長分子。
覆蓋均勻性
從1 ng DNA起始,stLFR文庫即可獲得與使用100 ng DNA起始的常規全基因組測序文庫相當的基因組覆蓋均勻性表現(圖4)。
圖4. stLFR 文庫測序深度均勻性。藍色實線為stLFR文庫,綠色虛線為100 ng起始的常規全基因組測序文庫,灰色虛線為理論預期深度分布(泊松分布),數據已均一化至30X覆蓋度。
SNP & InDel檢測
30X深度下,stLFR文庫SNP檢測陽性預測值(Positive predictive value, PPV)與靈敏度(Sensitivity)均可達到0.99以上,InDel檢測F值(F-measure)可達0.95,整體變異檢測表現達到相同深度的常規全基因組測序文庫表現的最佳水平(圖5)。
圖5. stLFR 文庫30X覆蓋度變異檢測能力評估。將stLFR檢測NA12878樣本的變異結果與Genome in a bottle(GIAB)提供的高置信區間檢測結果進行比較,計算陽性預測值與靈敏度。
二倍體定相
利用共標簽短讀序列,stLFR可以輕松獲得二倍體基因組上雜合位點定相信息,定相區塊N50值可達10 Mb以上(圖6)注3,可有效解析基因調控和編碼區變異組合。
注3: 該數據表現共同決定于初始DNA長度和測序深度。
圖6. stLFR 定相區塊在染色體上的分布情況。在40X深度下,stLFR文庫數據定相區塊N50值可達34 Mb,雜合位點定相比例高達99.7%
利用分子標簽和長片段信息,stLFR可以對多種結構變異進行準確檢測。圖7展示了stLFR對NA12878中已知的SV進行檢測,檢出率達到100%。圖8展示了利用stLFR文庫分別對攜帶5號染色體和12號染色體平衡易位病人樣本(圖8A)和已知2號染色體染色體內倒位的GM20759細胞系樣本(圖8B)進行檢測的結果。
圖7. 對NA12878中已知的SV進行檢測,檢出率能達到100%
圖8. stLFR 文庫結構變異結果展示。(A)攜帶5號染色體和12號染色體平衡易位病人樣本的stLFR檢測的分子標簽重疊熱度分布圖。(B)已知2號染色體染色體內發生倒位的GM20759細胞系樣本分子標簽重疊熱度分布圖。
stLFR變異檢測能力總結
古語有云,十年磨一劍。華大智造已經投入了五年時間進行stLFR技術的研發,并且會繼續對該技術進行優化升級。更多基于stLFR的技術,如二倍體從頭組裝等,也將陸續面世。希望在不遠的將來,可以通過stLFR技術最終實現完美基因組測序。
什么是完美基因組?怎么獲得完美基因組?請持續關注MGI華大智造公眾號,稍后為您揭曉。
掃描下方二維碼,申請測試stLFR文庫制備試劑盒