北京物流信息联盟

【好好学习喜迎国庆】DNA测序名词回顾

2021-06-08 14:39:47

今天是国庆长假的第二天,各位小伙伴们会不会玩的太开心了就把测序知识忘得一干二净了呢?来来来,利用坐地铁坐轮船坐小汽车的时间,和测序君一起回顾一下DNA测序的相关知识吧!

1

DNA测序(DNA sequencing)

分析特定DNA片段的碱基序列,也就是腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)与鸟嘌呤的(G)排列方式。快速的DNA测序方法的出现极大地推动了生物学和医学的研究和发现。

第一代DNA测序技术

传统的化学修饰法、双脱氧链终止法以及在它们的基础上发展来的各种DNA测序技术统称为第一代DNA测序技术。第一代测序技术在分子生物学研究中发挥过重要的作用, 如人类基因组计划主要基于第一代DNA测序技术。目前基于荧光标记和Sanger的双脱氧链终止法原理的荧光自动测序仪仍被广泛地应用。

Sanger法测序

利用一种DNA聚合酶来延伸结合在待定序列模板上的引物。直到掺入一种链终止核苷酸为止。每一次序列测定由一套四个单独的反应构成,每个反应含有所有四种脱氧核苷酸三磷酸(dNTP),并混入限量的一种不同的双脱氧核苷三磷酸(ddNTP)。由于ddNTP缺乏延伸所需要的3-OH基团,使延长的寡聚核苷酸选择性地在G、A、T或C处终止。终止点由反应中相应的双脱氧而定。每一种dNTPs和ddNTPs的相对浓度可以调整,使反应得到一组长几百至几千碱基的链终止产物。它们具有共同的起始点,但终止在不同的的核苷酸上,可通过高分辨率变性凝胶电泳分离大小不同的片段,凝胶处理后可用X-光胶片放射自显影或非同位素标记进行检测。荧光自动测序技术基于Sanger原理, 用荧光标记代替同位素标记, 并用成像系统自动检测, 从而大大提高了DNA测序的速度和准确性。

高通量测序技术(High-throughput sequencing)

又称“下一代”测序技术("Next-generation" sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。主要包括罗氏、Illumina,以及赛默飞等公司的测序平台。

离子半导体测序(Ion semiconductor sequencing)

使用半导体技术在化学和数字信息之间建立直接的联系。在半导体芯片的微孔中固定DNA链,随后依次掺入ACGT。在半导体芯片微孔里,DNA 聚合酶以单链DNA 为模板,按碱基互补原理,合成互补的DNA 链。DNA 链每延伸一个碱基时,就会释放一个质子,导致局部pH 值变化。随着每个碱基的掺入,释放出氢离子,在它们穿过每个孔底部时能被检测到,通过对H+ 的检测,实时判读碱基。与其他测序技术相比,使用该项技术的测序系统更简单、更快速、及更灵活。

Ion Torrent 半导体测序芯片的每个微孔里微球表面含有大约100万个DNA 分子拷贝。测序时一个个核苷酸分子连续流过芯片微孔。如果核苷酸与特定微孔中的DNA 分子互补,则该核苷酸被合成到DNA 分子中,并且释放氢离子,该孔溶液的PH 发生变化。离子传感器检测到PH 变化后,即刻便从化学信息转变为数字电子信息。如果DNA 链含有两个相同的碱基,则记录电压信号是双倍的。如果碱基不匹配,则无氢离子释放,也就没有电压信号的变化。这种方法属于直接检测DNA 的合成,因少了CCD 扫描,荧光激发等环节,几秒钟就可检测合成插入的碱基,大大缩短了运行时间。

DNA 纳米孔测序 (DNA nanoball sequencing)

将一条DNA 单链穿过在膜上的一个蛋白孔,并以此完成测序过程,而不需要扩增DNA 或者使用价格昂贵的试剂。电流从蛋白孔流过;不同的DNA 碱基会以不同的方式干扰流过该孔的电流,从而保证机器能够顺利地电子解读DNA 序列。

2

杂交法测序

20世纪80年代末出现的一种测序方法, 该方法不同于化学降解法和Sanger法, 而是利用DNA杂交原理, 将一系列已知序列的单链寡核苷酸片段固定在基片上, 把待测的DNA样品片段变性后与其杂交, 根据杂交情况排列出样品的序列信息。

大规模平行签名测序(Massively Parallel Signature Sequencing, MPSS)

由Lynx Therapeutics公司在90年代发展的Massively Parallel Signature Sequencing, MPSS技术是“下一代”测序技术发展的先驱。MPSS 是一种基于磁珠(bead)和接头(adaptor)连接和解码的复杂技术,测定结果短,多用于转录组测序,测定基因表达量。MPSS测定结果有序列偏好性而易丢失DNA中某些特定序列,且操作复杂,已逐渐淡出,被新的方法替代。

化学修饰法测序

化学试剂处理末段DNA片段,造成碱基的特异性切割,产生一组具有各种不同长度的DNA链的反应混合物,经凝胶电泳分离。化学切割反应:包括碱基的修饰修饰的碱基从其糖环上转移出去在失去碱基的糖环处DNA断裂。

鸟枪法

“鸟枪法”是一种由生物基因组提取目的基因的方法。首先利用物理方法(如剪切力、超声波等)或酶化学方法(如限制性内切核酸酶)将生物细胞染色体DNA切割成为基因水平的许多片段,继而将这些片段与适当的载体结合,将重组DNA转入受体菌扩增,获得无性繁殖的基因文库,再结合筛选方法,从众多的转化子菌株中选出含有某一基因的菌株,从中将重组的DNA分离、回收。

这种方法也就是应用基因工程技术分离目的基因,其特点是绕过直接分离基因的难关,在基因组DNA文库中筛选出目的基因。可以说这是利用“溜散弹射击”原理去“命中”某个基因。由于目的基因在整个基因组中太少太小,在相当程度上还得靠“碰运气”,所以人们称这个方法为“鸟枪法”或“散弹枪”实验法。

3

454 焦磷酸测序 (454 pyrosequencing)

由454公司发展的并行焦磷酸测序方法。该方法在油溶液包裹的水滴中扩增DNA(即emulsion PCR),每一个水滴中开始时仅包含一个包被大量引物的磁珠和一个链接到微珠上的DNA模板分子(控制DNA浓度出现的大概率事件)。将emlusion PCR产物加载到特制的PTP板上,板上有上百万个孔,每个微孔只能容纳一个磁珠。DNA Polymerase在将一个dNTP聚合到模板上的时候,释放出一个PPi(焦磷酸分子);在ATP-Sulfurylase(ATP硫酸化酶)催化下,PPi与APS生成一个ATP分子;ATP分子在Luciferase(荧光素酶)的作用下,将luciferin(荧光素)氧化成oxy luciferin,同时产生的可见光被CCD光学系统捕获,获得一个特异的检测信号,信号强度与相应的碱基数目成正比。通过按顺序分别并循环添加四种dNTP,读取信号强度和发生时间,实现DNA序列测定。这一技术的读长和每一碱基耗费都介于Sanger法测序和Solexa和SOLiD方法之间。454公司现下属于Roche公司。

Illumina (Solexa) sequencing

Solexa公司开发了一种可反转的染料终止法。DNA模板首先连接到与固体介质(如玻璃板)交联的引物上,并扩增形成本地微克隆。四种ddNTPs依次添加到体系中,未结合的ddNTPs在添加下一种核苷酸前被冲洗走。该方法即边合成边测序(Illumina公司技术,以DNA 单链为模板,在生成互补链时利用带荧光标记的dNTP 发出不同颜色的荧光来确定不同的碱基。新加入dNTP 的末端被可逆的保护基团封闭,既保证单次反应只能加入一个碱基,又能在该碱基读取完毕后,将保护基团除去,使得下一个反应可继续进行。)

ABI SOLiD sequencing

SOLiD 全称为Supported Oligo Ligation Detetion,它以4 色荧光标记寡核苷酸的连续连接反应为基础,而没有采用传统的边合成边测序技术。连接反应没有DNA 聚合酶合成过程中常有的错配问题,而SOLiD 特有的“双色球编码技术”又提供了一个纠错机制,这样设计上的优势使得SOLiD 在系统准确性上大大领先于其他平台。

4

全基因组重测序(Whole Genome Resequencing)

对基因组序列已知的个体进行全基因组范围的测序,并在个体或群体水平上进行差异性分析的方法。随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围,通过构建全基因组文库,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。

该项技术可用于以下研究

1)检测疾病样本中高风险碱基变异位点和对应的基因;

2)配合大样本分析,确定孟德尔遗传疾病(Mendelian disease)相关SNP位点和基因;

3)在癌症研究过程中,检测癌症样本染色体上的突变位点、结构变异、染色体拷贝数变化以及潜在的融合基因;

4)用于种群遗传学的大规模样本基因组分析,检测SNP位点、LD并绘制种群图谱;

5)在染色体异常相关的疾病研究中,检测疾病样本中的染色体拷贝数异常;

6)用于个人基因组分析,结合数据库信息,建立个人SNP位点与疾病易感性、药物耐受性以及其他诸多表型之间的关系档案。

外显子组测序(Exome sequencing)

利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。由于外显子组测序捕获目标区域只占人类基因组长度的约1%,因此远比进行全基因组序列测序来得更简便、经济,目标区域覆盖度也更高,便于变异检测。

该项技术可用于以下研究

1)检测疾病样本中外显子区域内高风险碱基变异位点;

2)配合大样本分析,确定孟德尔遗传疾病相关外显子SNP位点和基因;

3)在癌症研究过程中,检测癌症样本外显子区域内的体细胞突变位点和潜在的融合基因;

4)用于种群遗传学研究的大规模样本基因组分析,检测SNP位点、LD并绘制种群图谱。


靶向测序

靶向测序即研究人员针对细胞中多种类型感兴趣的特定基因进行超深度测序。靶向测序让研究人员能够最大限度利用他们的测序运行,将精力集中在那些感兴趣的序列上。并简化了实验室操作和数据解释。未来更大规模的研究可以展示这一方法具有根据疾病发展、遗传图谱分析、环境影响或其他因素来对患者进行划分的潜质。迄今为止的研究表明,这种方法极有潜力成为一种诊断工具。


从头测序(De novo sequencing)

从头测序分析不依赖于任何参考序列信息就可进行测序分析,使用生物信息学方法进行序列拼接获得该物种的基因组序列图谱,并进行基因组结构注释、功能注释、比较基因组学分析等一系列的后续分析,该类型测序分析结果可以广泛应用于农林鱼牧医药及海洋等各个方面。

该项技术可用于以下研究

1)动植物基因组图谱的系统性构建

2)复杂性状基因的研究和动植物分子育种应用

3)基因组图谱的系统性构建

4)微生物致病性和耐药性位点检测及相关基因功能研究

5)微生物的比较基因组分析,确定各个近缘微生物中的系统发育关系

宏基因组测序(Metagenomic Sequencing)

对微生物群体进行高通量测序,分析特定环境中微生物群体基因组成及功能、微生物群体的多样性与丰度,进而分析微生物与环境、微生物与宿主之间的关系,发现具有特定功能的基因。宏基因组测序无需分离纯培养微生物,较大扩展了微生物资源的利用,为环境微生物群落的研究提供了有效工具。宏基因组深度测序可以揭示或估计环境中真实的物种多样性和遗传多样性,挖掘具有应用价值的基因资源,应用于开发新的微生物活性物质。宏基因组研究分两个方向:扩增子测序和全基因组测序。

目前,宏基因组分析更多地使用宏全基因组测序技术来产生数据并完成后续一系列数据处理和挖掘。相比于基于16S基因测序的宏基因组研究方法,基于全基因组测序的宏基因组研究方法可以全面的分析微生物的物种、基因组成。

扩增子测序(Amplicon Sequencing)涉及特定序列位点的PCR扩增,通常是16S/18S rDNA。宏基因组的物种分类,一般用OUT(operational taxonomic unit),即可操作单元来表示。通常原生生物使用16S rDNA来衡量,真核生物的OUT使用18S rDNA来衡量。

该项技术可用于以下研究:

1)通过宏基因组测序的方法,将肠道微生物与疾病进行关联分析以揭示疾病与健康个体间的微生物差异;

2)鉴定特定环境中的特定微生物发现耐受菌种及相关基因。

3)可以研究物种的分类,研究与特定环境相关的代谢通路,以及通过不同样品的比较研究微生物群落内部、微生物与环境、微生物与宿主之间的关系。

5

表观遗传学

表观遗传学是研究基因的核苷酸序列不发生改变的情况下,基因表达的可遗传的变化的一门遗传学分支学科。表观遗传的现象很多,已知的有DNA甲基化(DNA methylation),基因组印记(genomic imprinting),母体效应(maternal effects),基因沉默(gene silencing),核仁显性,休眠转座子激活和RNA编辑(RNA editing)等。

染色质免疫共沉淀测序(ChIP-seq)

染色质免疫共沉淀技术(Chromatin Immunoprecipitation,ChIP)也称结合位点分析法,是研究体内蛋白质与DNA相互作用的有力工具,通常用于转录因子结合位点或组蛋白特异性修饰位点的研究。将ChIP与第二代测序技术相结合的ChIP-Seq技术,能够高效地在全基因组范围内检测与组蛋白修饰、转录因子等互作的DNA区段。利用该种技术,通过将测序结果精确定位到基因组上,研究人员可获得全基因组范围内与组蛋白、转录因子等互作的DNA区段信息。

该项技术可用于以下研究

1)处于特定时期或特定处理条件下的样本中,特定转录因子在染色体上的结合位置检测;

2)各种类型组蛋白修饰在染色体上的分布特征;

3)疾病样本中,与疾病发生发展相关的组蛋白修饰表观遗传机理研究和相关表观分子标志的探索性研究;

4)研究其他各类与DNA能发生互作的蛋白因子在染色体上的定位特征;

5)不同条件处理下,特定蛋白因子在染色体上的定位变化。

MeDIP-seq(Methylated DNA Immunoprecipitation Sequencing)

甲基化DNA免疫共沉淀测序。该种测序方法通过使用5'-甲基胞嘧啶抗体特异性抓去样本中甲基化程度高的DNA片段,并对富集的DNA片段进行高通量测序。相对于BS-seq和RRBS-seq技术而言,MeDIP-seq技术以较小的数据量和较高的性价比,帮助科研人员检测基因组上的甲基化区域。但MeDIP-seq生成DNA甲基化图谱最小分辨率在50-100bp左右,无法达到BS-seq和RRBS-seq的单碱基分辨率。

该项技术可用于以下研究

1)处于特定时期或特定处理条件下的样本中,研究样本中染色体DNA甲基化模式;

2)比较不同细胞、组织、样本间的DNA甲基化修饰模式的差异。

3)疾病样本中,与疾病发生发展相关的DNA甲基化表观遗传机理研究和相关DNA甲基化分子标志物的探索性研究。


WGBS-seq和RRBS-seq

WGBS全称Whole Genome Bisulfite Seuqneicng,即全基因组重亚硫酸盐测序。该方法通过Bisulfite处理,将原基因组中未发生甲基化的C碱基转换成U的同时,保留所有甲基化C的碱基不发生转变,从而帮助科研人员识别发生甲基化的CpG位点。该种测序技术适用于绘制单碱基分辨率的全基因组DNA甲基化图谱。

RRBS全称Reduced Representation Bisulfite Sequencing,即简化代表性重亚硫酸盐测序。该方法在Bisulfite处理前,使用MspI(该酶的酶切位点为CCGG)酶切对样本进行处理,去除低CG含量DNA片段,从而使用较小的数据量富集到尽可能多的包含CpG位点的DNA片段。

相比于WGBS技术,RRBS是一种准确、高效且经济的DNA甲基化研究方法,通过酶切,并进行Bisulfite测序,该方法在保证DNA甲基化状态检测的高分辨率的同时提升测序数据的高利用率。

该项技术可用于以下研究

1)处于特定时期或特定处理条件下的样本中,研究样本中染色体高精度DNA甲基化模式;

2)比较不同细胞、组织、样本间的高精度DNA甲基化修饰模式的差异;

3)疾病样本中,与疾病发生发展相关的高精度DNA甲基化表观遗传机理研究和相关高精度DNA甲基化位点分子标志的探索性研究。


6

测序质量

高通量测序数据以FASTQ 格式来记录所测的碱基读段和质量分数.以测序读段为单位存储,每条读段占4 行,其中第1 行和第3行由文件识别标志和读段名(ID)组成(第1 行以“@”开头而第3 行以“+”开头;第3 行中ID 可以省略,但“+”不能省略),第2 行为碱基序列,第4行为对应的测序质量分数.对于每一条序列,其每一个碱基都有一个对应的测序质量值。

测序深度

被测基因组上单个碱基被测序的平均次数,比如某样本的测序深度为30X,那么该样本的基因组上每一个单碱基平均被测序了30次。

测序覆盖度

大片段拼接的gap、测序读长有限、重复序列等问题的存在,测序分析后组装得到的基因组序列通常无法完全覆盖所有区域,覆盖度就是最终得到的结果占整个基因组的比例。例如一个人的基因组测序,覆盖度为98.5%,那么说明该基因组还有1.5%的区域通过我们的组装和分析无法得到。

Q20/Q30

高通量测序中,每测一个碱基会给出一个相应的质量值,这个质量值是衡量测序准确度的。碱基的质量值13,错误率为5%,20的错误率为1%,30的错误率为0.1%。质量值是Q20,则错误识别的概率是1%,即错误率1%,或者正确率是99%;质量值是Q30,则错误识别的概率是0.1%,即错误率0.1%,或者正确率是99.9%。

7

ctDNA

循环肿瘤DNA。是指来自肿瘤细胞的循环游离DNA。是cfDNA的一个小的亚类。研究表明一个100g的实体肿瘤大概含有3*10^10个肿瘤细胞,每天大约有3.3%的肿瘤细胞DNA进入循环血。这些循环肿瘤DNA的长度基本上在70-200bp,有的能够长达21kb。这些来自肿瘤的cfDNA,常常携带有肿瘤细胞的一些特质,如特定的突变,结构改变,表观遗传信息等从而成为肿瘤的诊断、复发监测、疗效评估的有效手段。

cfDNA

全称循环游离DNA(Circulating free DNA ),是指存在于循环血中的DNA片段。cfDNA可以来源于凋亡、坏死的细胞释放释放的DNA片段;细胞以囊泡的形式分泌到循环血中的DNA片段;外源微生物的DNA片段(如病毒DNA)等。它既可以是来自于体内正常的细胞,也可能是来自肿瘤细胞,或者外源微生物。

单基因遗传病

单基因病是指由1对等位基因控制的疾病或病理性状。基因位于染色体上,一条染色体上有多个基因,基因在染色体上呈线性排列。等位基因是在指位于两条同源染色体的相同位置上的两个基因,非等位基因位于染色体的不同位置上。目前发现的单基因遗传病有6600多种,并且以每年新发现10-50种的速度增长。


全基因组关联分析(GWAS)

在全基因组范围内找出存在的序列变异,即单核苷酸多态性(SNP),从中筛选出与疾病相关的SNPs。



PGS

胚胎植入前遗传学筛查(Preimplantation Genetic Screening, PGS )是指胚胎植入着床之前,对早期胚胎进行染色体数目和结构异常的检测,通过一次性检测胚胎23对染色体的结构和数目,分析胚胎是否有遗传物质异常的一种早期产前筛查方法。从而挑选正常的胚胎植入子宫,以期获得正常的妊娠,提高患者的临床妊娠率,降低多胎妊娠。






友情链接

Copyright © 2023 All Rights Reserved 版权所有 北京物流信息联盟