二代测序技术原理详解:主流测序平台的技术差异与应用选择
一、二代测序技术概述
二代测序(Next-Generation Sequencing, NGS)是相对于传统Sanger测序的革命性突破,其核心特点是高通量、并行化和低成本,使大规模基因组测序成为可能。与一代测序相比,二代测序通过边合成边测序(Sequencing by Synthesis, SBS)或连接法测序等技术,实现了数百万至数十亿条DNA片段的同时读取,单次运行可产生GB至TB级数据。目前主流的二代测序平台包括Illumina、Thermo Fisher Ion Torrent和BGI-MGI等,它们在原理、读长、准确度和应用场景上各有特点。
二、主流二代测序技术原理与区别
1. Illumina测序技术(桥式PCR+边合成边测序)
核心技术:
- 文库制备:DNA片段化后加接头,固定在流动槽(Flow Cell)上。
- 桥式PCR扩增:通过桥式扩增形成DNA簇(Cluster),每个簇包含约1000个相同模板的拷贝。
- 四色荧光标记:使用可逆终止子dNTP,每轮合成一个碱基,通过荧光信号读取碱基类型。
- 图像采集与碱基识别:高分辨率相机拍摄荧光信号,软件解析碱基序列。
技术特点:
- 读长:短读长(50-300 bp),适合高精度测序。
- 通量:单次运行可达Tb级数据(如NovaSeq 6000)。
- 准确率:>99.9%,适合全基因组测序(WGS)、外显子测序(WES)和转录组测序(RNA-seq)。
缺点:
- 读长较短,不利于结构变异检测。
- 依赖光学系统,设备成本高。
2. Thermo Fisher Ion Torrent(半导体测序)
核心技术:
- 乳液PCR:DNA片段与微珠结合,在油包水液滴中扩增,形成单克隆DNA微球。
- 半导体芯片检测:微球沉积在半导体芯片上,H⁺离子释放导致pH变化,芯片检测电信号变化。
- 无荧光标记:直接检测合成新碱基时释放的H⁺,无需光学系统。
技术特点:
- 读长:200-400 bp,适合靶向测序(如肿瘤panel)。
- 通量:较低(Gb级),但运行速度快(2-4小时)。
- 准确率:>99%,但在同聚物(如AAAA)区域易出错。
缺点:
3. BGI-MGI(DNB纳米球测序+联合探针锚定聚合)
核心技术:
- DNA纳米球(DNB):通过滚环扩增(RCA)形成纳米球,减少PCR错误。
- 联合探针锚定聚合(cPAS):使用荧光探针和锚定引物进行合成测序。
- 高密度芯片:DNB排列在芯片上,实现高密度测序。
技术特点:
- 读长:50-200 bp,类似Illumina但成本更低。
- 通量:灵活,适合中小型项目。
- 国产化优势:设备成本较低,适合临床和科研机构。
缺点:
4. 454测序(焦磷酸测序,已淘汰)
核心技术:
- 乳液PCR:类似Ion Torrent,但使用焦磷酸测序(Pyrosequencing)。
- 光信号检测:每加入一个dNTP释放焦磷酸,产生荧光信号。
技术特点:
- 长读长:700-1000 bp,曾是宏基因组研究首选。
- 缺点:成本高、通量低,已被Illumina取代。
三、二代测序技术对比与选择指南
技术平台 | 测序原理 | 读长 | 通量 | 准确率 | 主要应用 |
---|
Illumina | 桥式PCR+SBS | 50-300 bp | 高(Tb级) | >99.9% | WGS, WES, RNA-seq |
Ion Torrent | 半导体测序(pH检测) | 200-400 bp | 中(Gb级) | >99% | 靶向测序、临床诊断 |
BGI-MGI | DNB+cPAS | 50-200 bp | 灵活 | >99.5% | 科研、临床 |
454(已淘汰) | 焦磷酸测序 | 700-1000 bp | 低 | >99% | 宏基因组(历史技术) |
选择建议:
- 全基因组测序(WGS):首选Illumina,因其高准确性和通量。
- 靶向测序(如肿瘤panel):Ion Torrent或BGI-MGI,快速且成本低。
- 临床诊断:Ion Torrent(快速)或BGI-MGI(性价比高)。
- 宏基因组研究:Illumina(短读长)结合三代测序(长读长)。
四、二代测序的未来趋势
尽管三代测序(如PacBio和Nanopore)在长读长方面具有优势,但二代测序凭借高准确性、成熟的分析流程和低成本,仍是科研和临床的主流选择。未来,二代测序可能向单分子测序和更高通量方向发展,同时与AI结合提升数据分析效率。
结论
二代测序技术的多样化使研究人员可以根据项目需求(读长、通量、成本)选择最合适的平台。Illumina仍是金标准,但Ion Torrent和BGI-MGI在特定场景下具有竞争力。理解不同技术的原理和差异,有助于优化实验设计并提高数据质量。