根据美国科技网站Ars Technica报导, DNA的4个碱基(A, C, G, T)能以不同方式改变奈米孔两侧电流与电压, 透过测量该电流与电压的变化, 就能分别对于单链DNA进行定序.
六年后的今天, 研究人员由于关注这些蛋白质奈米孔的特性, 发现了该定序仪的新用途. 在日前发表于《自然生物技术》(Nature Biotechnology)期刊的论文中, 英国伯明罕大学的研究人员介绍该定序仪所提供的超长读长(long read), 以及如何将它用于为先前抗拒表征的人类基因组进行定序. 该装置还可用于决定来自另一个基因的两组染色体, 为整个基因组定位表观遗传学控制的区域.
该定序仪的新用途是由英国伯明罕大学(University of Birmingham)微生物与感染学研究所教授Nick Loman和博士班研究生Josh Quick共同开发的. Quick在发展读长方法方面扮演重要角色.
虽然该定序仪仍然易于出错, 但比起具有较高准确度的定序仪发生错误时却更胜一筹, 特别是在读取具有超过200个碱基的DNA时. 当DNA重复时, 其他的软件程式也没辄了. 而当高度准确的装置搭配Oxford Nanopore的小型装置使用时, 可实现一种提供序列的折衷方案, 并显示该序列如何形成更大的部份.
该研究采用不同的软件解决方案和电压数据诠释数据, 探索几种产生最佳奈米孔定序的方法. 研究人员以多种方法进行多次读取和绘图, 最终达到了99.44%的准确率.
Ars Technica的报导中解释, 因为我们继承了分别来自父母的两个复制染色体——尽管版本不同, 但底层的DNA是相同的. 这意味着短读长的DNA无法确定二者分别为何. 因此, 奈米孔提供的长读取极其关键. 在实验过程中, 研究人员发现其读长高达88.2万个碱基, 这是在最初的基因组定序计划中无法实现的. 研究人员并预测, 这项新的应用将有助于填补原始基因组计划中的所有空缺.
研究人员在研究过程中确实也遇到了一些挑战. 他们发现用于保存DNA数据的通用档案规格无法处理过长的序列, 导致分析软件出现故障. 当然, 如果能更新软件使其包含这项功能, 那么未来应用可能性是无止境的.
Loman说: '即使是在一年前, 实际上也还难以对整个人类的基因组进行定序, 但得力于奈米孔等技术近来的进展和创新, 我们现在已能定序非常长的基因组片段. ' 他还把这种定序方法比喻为拼图.
'在这项研究中, 最重要的发现之一是, 即使完成了人类基因组参考或者认为已经完成一段时间了, 它仍然包含许多不足的部份, 我们开发的新方法采用奈米孔定序发展出超长读长, 从而缩短了序列中的一些差距. '
编译: Susan Hong