测序技术发展现状
根据发展历史、影响力、测序原理和技术不同等,主要有以下几种:大规模平行签名测序(Massively Parallel Signature Sequencing, MPSS)、聚合酶克隆(Polony Sequencing)、454焦磷酸测序(454 pyrosequencing)、Illumina (Solexa) sequencing、ABI SOLiD sequencing、离子半导体测序(Ion semiconductor sequencing)、DNA 纳米球测序(DNA nanoball sequencing)等。
随着第二代测序技术的迅猛发展,科学界也开始越来越多地应用第二代测序技术来解决生物学问题。比如在基因组水平上对还没有参考序列的物种进行重头测序(de novo sequencing),获得该物种的参考序列,为后续研究和分子育种奠定基础;对有参考序列的物种,进行全基因组重测序(resequencing),在全基因组水平上扫描并检测突变位点,发现个体差异的分子基础。在转录组水平上进行全转录组测序(whole transcriptome resequencing),从而开展可变剪接、编码序列单核苷酸多态性(cSNP)等研究;或者进行小分子RNA测序(small RNA sequencing),通过分离特定大小的RNA分子进行测序,从而发现新的microRNA分子。在转录组水平上,与染色质免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技术相结合,从而检测出与特定转录因子结合的DNA区域和基因组上的甲基化位点。
高通量测序技术的应用
测序技术推进科学研究的发展。随着第二代测序技术的迅猛发展,科学界也开始越来越多地应用第二代测序技术来解决生物学问题。比如在基因组水平上对
还没有参考序列的物种进行重头测序(de novo sequencing),获得该物种的参考序列,为后续研究和分子育种奠定基础;对有参考序列的物种,进行全基因组重测序(resequencing),在全基因组水平上扫描并检测突变位点,发现个体差异的分子基础。在转录组水平上进行全转录组测序(whole transcriptome resequencing),从而开展可变剪接、编码序列单核苷酸多态性(cSNP)等研究;或者进行小分子RNA测序(small RNA sequencing),通过分离特定大小的RNA分子进行测序,从而发现新的microRNA分子。在转录组水平上,与染色质免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技术相结合,从而检测出与特定转录因子结合的DNA区域和基因组上的甲基化位点。
需要特别指出的是第二代测序结合微阵列技术而衍生出来的应用--目标序列捕获测序技术(Targeted Resequencing)。这项技术首先利用微阵列技术合成大
量寡核苷酸探针,这些寡核苷酸探针能够与基因组上的特定区域互补结合,从而富集到特定区段,然后用第二代测序技术对这些区段进行测序。目前提供序列捕获的厂家有Agilent和Nimblegen ,应用最多的是人全外显子组捕获测序。科学家们目前认为外显子组测序比全基因组重测序更有优势,不仅仅是费用较低,更是因为外显子组测序的数据分析计算量较小,与生物学表型结合更为直接。
目前,高通量测序开始广泛应用于寻找疾病的候选基因上。内梅亨大学的研究人员使用这种方法鉴定出Schinzel-Giedion 综合征中的致病突变,Schinzel-Giedion综合征是一种导致严重的智力缺陷、肿瘤高发以及多种先天性畸形的罕见病。他们使用Agilent SureSelect序列捕获和SOLiD对四位患者的外显子组进行测序,平均覆盖度为43倍,读长为50 nt,每个个体产生了2.7-3 GB可作图的序列数据。他们聚焦于全部四位患者都携带变异体的12个基因,最终将候选基因缩小至1个。而贝勒医学院基因组测序中心也计划对15种以上疾病进行研究,包括脑癌、肝癌、胰腺癌、结肠癌、卵巢癌、膀胱癌、心脏病、糖尿病、自闭症以及其他遗传疾病,以更好地理解致病突变以及突变对疾病的影响。前不久刚刚结束的Science杂志年度十大科学突破评选中,外显子组测序名列其中。
测序技术总结与展望
第一代测序技术凭借其长的序列片段和高的准确率,适合对新物种进行基因组长距框架的搭建以及后期GAP填补,但是成本昂贵,而且难以胜任微量DNA样品的测序工作。第二代测序技术中,454序列片段最长,比较适合对未知基因组从头测序,搭建主体结构,但是在判断连续单碱基重复区时准确度不高。Solexa较454具有通量高、片段短、价位低的特点,可以用于大基因组和小基因组的测序和重测序。Solexa双末端测序(paired-end sequencing)可以为基因组进一步拼接提供定位信息,但是随着反应轮数增加,序列长度和质量均有所下降,而且在阅读AT区时有明显错误倾向。SOLiD基于双碱基编码系统的纠错能力以及较高的测序通量,适合转录本研究以及比较基因组学特别是SNP检测等,但是测序的片段短限制了该技术在基因组拼接中的广泛应用。第三代测序技术目前正在研发阶段,尚未正式投入使用。