提高长读基因组测序的准确性
来自美国,德国和中国的研究机构的研究小组已经开发出一种方法来提高长读基因组测序的准确性。在他们发表在“自然生物技术”杂志上的论文中,该小组概述了他们如何改进现有技术,以及它如何运作。
研究人员开始他们的工作时指出,DNA测序技术目前的现状允许准确地测序短序列(短读取),或者不太准确地测序长序列(长读取)。在这项新的努力中,他们试图提高长读序列的准确性。更具体地,他们试图使用Pacific Bioscience(PacBio)进行的单分子实时(SMRT)测序来提高循环共有测序(CCS)技术的准确性。该项目的大部分团队来自PacBio-其他成员来自谷歌,斯坦福大学,马克斯普朗克研究所,萨尔大学,DNAnexius,NIST,国家人类基因组研究所,中国农业科学院,达纳法伯癌症研究所和约翰霍普金斯大学。
PacBio目前使用的CCS技术(不被认为是长读技术)涉及使用发夹衔接子,其连接到DNA分子的末端以产生模板。聚合酶从衔接子开始并移过DNA片段,随着时间的推移添加碱基,从而产生读数。该技术还涉及多次将聚合酶移过DNA位。研究人员指出,CCS技术通常使用的基础长度为1000到2000个碱基。通过改进技术,该团队能够准确读取多达10,000个碱基。
研究人员报告说,他们的改进主要基于提高测序开始时使用的DNA质量。通过在装载DNA之前开始反应然后等待长达一小时来改善DNA的质量 - 如果他们发现聚合酶仍在移动,则必须具有更高的质量。他们还确保DNA分子的大小均匀 - 他们使用SageELF仪器完成了这项工作。
该团队报告说,改进的技术产生了长读数(平均13.5千碱基),准确率达到99.9%。