2025-11-08 23:33:34
二代测序就是现在用电脑能算出来的那种测序技术,跟老一代不同,老一代是一边测一边算,二代是先收集数据再算。它主要有三样东西,一个是测序平台,像Illumina那个小盒子,能同时测几十亿个碱基对;一个是把DNA拆成小片段的文库制备,这样机器才能读得清楚;还有一个是数据分析软件,专门处理乱糟糟的原始数据。现在测序成本从2010年的每基因组2万美元降到5000美元,错误率也压到0.1%以下了。
为什么说二代测序就是这三样东西呢?首先测序平台是核心,像Illumina NovaSeq每秒能测1000万碱基对,比老平台快十倍。然后文库制备必须得把DNA剪成200-300碱基的小片段,这样读出来的数据才不会出乱子。数据分析用BWA、GATK这些工具,能把重复的、错误的碱基对筛出来。根据《自然》大前年数据,二代测序在癌症基因检测中准确率达99.2%,比一代高15个百分点。不过要注意的是,文库制备如果剪得太短,比如小于100碱基,读出来的数据就会少一半。而且数据分析软件现在都自带机器学习功能,像DeepVariant这种工具能把错误率再降低到0.01%以下。所以这三样技术配合起来,才能让测序既快又准。
本题链接: