SNP及检测技术

更新时间:2023-12-15 12:38:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

1定义:

单核苷酸多态性(single nucleotide polymorphism,SNP),主要是指在基因组水平上由单个核苷酸的变异所引起的DNA序列多态性。它是人类可遗传的变异中最常见的一种。占所有已知多态性的90%以上。SNP在人类基因组中广泛存在,平均每500~1000个碱基对中就有1个,估计其总数可达300万个甚至更多。SNP所表现的多态性只涉及到单个碱基的变异,这种变异可由单个碱基的转换(transition)或颠换(transversion)所引起,也可由碱基的插入或缺失所致。但通常所说的SNP并不包括后两种情况。单核苷酸多态性(SNP)是指在基因组上单个核苷酸的变异,包括置换、颠换、缺失和插入。所谓转换是指同型碱基之间的转换,如嘌呤与嘌呤( G2A) 、嘧啶与嘧啶( T2C) 间的替换;所谓颠换是指发生在嘌呤与嘧啶(A2T、A2C、C2G、G2T) 之间的替换。从理论上来看每一个SNP 位点都可以有4 种不同的变异形式,但实际上发生的只有两种,即转换和颠换,二者之比为2:1。SNP 在CG序列上出现最为频繁,而且多是C转换为T ,原因是CG中的C 常为甲基化的,自发地脱氨后即成为胸腺嘧啶。一般而言,SNP 是指变异频率大于1 %的单核苷酸变异。在人类基因组中大概每1000 个碱基就有一个SNP ,人类基因组上的SNP 总量大概是3 ×106 个。依据排列组合原理,SNP 一共可以有6种替换情况,即A/ G、A/ T、A/ C、C/ G、C/ T 和G/ T ,但事实上,转换的发生频率占多数,而且是C2T 转换为主,其原因是Cp G的C 是甲基化的,容易自发脱氨基形成胸腺嘧啶T , Cp G 也因此变为突变热点。理论

上讲,SNP既可能是二等位多态性,也可能是3个或4个等位多态性,但实际上,后两者非常少见,几乎可以忽略。因此,通常所说的SNP都是二等位多态性的。这种变异可能是转换(C T,在其互补链上则为G A),也可能是颠换(C A,G T,C G,A T)。转换的发生率总是明显高于其它几种变异,具有转换型变异的SNP约占2/3,其它几种变异的发生几率相似。Wang等的研究也证明了这一点。转换的几率高,可能是因为CpG二核苷酸上的胞嘧啶残基是人类基因组中最易发生突变的位点,其中大多数是甲基化的,可自发地脱去氨基而形成胸腺嘧啶。

SNP 在动物基因组中分布广泛,每一个核苷酸发生突变的概率大约为10 - 9 。由于选择压力,SNP在单个基因、整个基因组中以及种群间的分布是不均匀的。SNP 在非编码区中要多于编码区,而且在编码区也是非同义突变(有氨基酸序列的改变) 的频率比其他方式突变的频率低得多[4 ] 。而基因间,同一种基因中的编码SNP (coding SNP ,cSNP) 的数目也不相同,可从0~29 个不等。多项研究同时发现不同种族间SNPs 的数目也是不同的,非洲人群及非裔种族中SNPs 数量最多,而其他种群的SNPs 要少得多,因此通过比较亚群间等位基因的频率将有助于阐明种族的结构和进化。

在基因组DNA中,任何碱基均有可能发生变异,因此SNP既有可能在基因序列内,也有可能在基因以外的非编码序列上。总的来说,位于编码区内的SNP(coding SNP,cSNP)比较少,因为在外显子内,

其变异率仅及周围序列的1/5.但它在遗传性疾病研究中却具有重要意义,因此cSNP的研究更受关注。

从对生物的遗传性状的影响上来看,cSNP又可分为2种:一种是同义cSNP(synonymous cSNP),即SNP所致的编码序列的改变并不影响其所翻译的蛋白质的氨基酸序列,突变碱基与未突变碱基的含义相同;另一种是非同义cSNP(non-synonymous cSNP),指碱基序列的改变可使以其为蓝本翻译的蛋白质序列发生改变,从而影响了蛋白质的功能。这种改变常是导致生物性状改变的直接原因。cSNP中约有一半为非同义cSNP。

先形成的SNP在人群中常有更高的频率,后形成的SNP所占的比率较低。各地各民族人群中特定SNP并非一定都存在,其所占比率也不尽相同,但大约有85%应是共通的。 2.SNP自身的特性:

1)SNP数量多,分布广泛。据估计,人类基因组中每1000个核苷酸就有一个SNP,人类30亿碱基中共有300万以上的SNPs.SNP 遍布于整个人类基因组中,根据SNP在基因中的位置,可分为基因编码区SNPs(Coding-region SNPs,cSNPs)、基因周边SNPs(Perigenic SNPs,pSNPs)以及基因间SNPs(Intergenic SNPs,iSNPs)等三类。 2) SNP适于快速、规模化筛查。组成DNA的碱基虽然有4种,但SNP一般只有两种碱基组成,所以它是一种二态的标记,即二等位基

因(biallelic)。 由于SNP的二态性,非此即彼,在基因组筛选中SNPs往往只需+/-的分析,而不用分析片段的长度,这就利于发展自动化技术筛选或检测SNPs。

3) SNP等位基因频率的容易估计。采用混和样本估算等位基因的频率是种高效快速的策略。该策略的原理是:首先选择参考样本制作标准曲线,然后将待测的混和样本与标准曲线进行比较,根据所得信号的比例确定混和样本中各种等位基因的频率。

4) 易于基因分型。SNPs 的二态性,也有利于对其进行基因分型。对SNP进行基因分型包括三方面的内容:(1)鉴别基因型所采用的化学反应,常用的技术手段包括:DNA分子杂交、引物延伸、等位基因特异的寡核苷酸连接反应、侧翼探针切割反应以及基于这些方法的变通技术;(2)完成这些化学反应所采用的模式,包括液相反应、固相支持物上进行的反应以及二者皆有的反应。(3)化学反应结束后,需要应用生物技术系统检测反应结果。

绝大多数疾病的发生与环境因素和遗传因素的综合作用有关,通常认为是在个体具有遗传易感性的基础上,环境有害因素作用而导致疾病。不同群体和个体对疾病的易感性、抵抗性以及其他生物学性状(如对药物的反应性等)有差别,其遗传学基础是人类基因组DNA 序列的变异性, 其中最常见的是SNP.易感基因的特点是基因的变异本身并不直接导致疾病的发生,而只造成机体患病的潜在危险性增加,一

旦外界有害因素介入, 即可导致疾病发生。另外在药物治疗中,易感基因的变异造成药物对机体的疗效和副作用不同。

随着人类基因组计划的进展,人们愈来愈相信基因组中的SNP 有助于解释个体的表型差异、不同群体和个体对疾病,特别是对复杂疾病的易感性以及对各种药物的耐受性和对环境因子的反应。因此, 寻找和研究SNP 已成为人类基因组计划的内容和目标之一。 多态性与突变的区别

1、多态性是一个群体概念,多态性指这个差异占群体的1%以上。否则就叫突变(小于1%)

2、SNP是多态性中的一种,只是进一步限定了差异只是单碱基。 3、SNP一般来说,是全部体细胞一样的基因型(除开嵌合体)。 4、突变一般不是一个个体全部细胞的变化。

5、如果突变发生在生殖细胞,则可以遗传,但是只要这个突变群没有达到总群体的1%,它就只是一个突变株/系。达到了1%就是多态性了。 常用数据库:

Human Gene Mutation Database (HGMD) //

http://www.uwcm.ac.uk/uwcm/mg/hgmd0.html // The Genome

Database (GD) //http://www.gdb.org //Database of Single Nuleotide Polymorphisms (dbSNP) // http://www.ncbi.nlm.nih.gov/SNP/ //Human Genome Variation Database (HGVbase)

//http://hgvbase.cgb.ki.se/ //The Snp Consortium, LTD.(TSC) //http://snp.cshl.org/ //www.hapmap.org 3.SNP现有检测技术

人们对SNP 的研究方法进行了许多探索和改进。SNP 分析技术按其研究对象主要分为两大类,即: ①对未知SNP 进行分析,即找寻未知的SNP 或确定某一未知SNP 与某遗传病的关系。检测未知SNP 有许多种方法可以使用,如温度梯度凝胶电泳( TGGE) 、变性梯度凝胶电泳(DGGE) 、单链构象多态性(SSCP) 、变性的高效液相色谱检测(DHPLC) 、限制性片段长度多态性(RFL P) 、随机扩增多态性DNA(RAPD) 等,但这些方法只能发现含有SNP 的DNA 链,不能确知突变的位置和碱基类别,要想做到这一点,必须对那些含有SNP 的DNA 链进行测序。②对已知SNP 进行分析,即对不同群体SNP遗传多样性检测或在临床上对已知致病基因的遗传病进行基因诊断。筛查已知SNP 的方法有等位基因特异寡核苷酸片段分析(ASO) 、突变错配扩增检验(MAMA) 、基因芯片技术(gene chips) 等。由于人类基因工程的带动,许多物种都已开始了基因组的项目,并建立了大量数据库,比较这些来自不同实验室不同个体的序列, 就可以检测到 SNP。

SNP位点信息已知的情况下, 选择SNP的GENOTYPING的方法,主要根据你的经费情况设计,我分别给你分析一下现状: A、一般实验室: 经费一般, 仪器不具备时, 最多用的是以下两种方法:

1、 基于PCR的方法,也叫AS-PCR, (ALLELE-SPECIFIC PCR)的办法。 主要原理是利用引物在扩增时3'端相对高的BASE要求,进行设计。这个方法是最便宜的, 不需要酶切, 一次PCR就可以得到GENOTYPING的信息。

缺点: PCR对于3'端的特异性在不同退火温度时有出入, 所以退火温度的摸索很关键,否则假阳性扩增是很容易的。另外, 内参照的设置也很重要,这个东西还是很有意思的。 而且,所使用的引物位置无法人为调整,只能放在SNP的5'段。

2、基于酶切分型。 依靠限制性内切酶的忠贞性进行单SNP的分型。 SNP突变与否, 可能影响某个酶识别位点的存在或消失。 通过酶切产物的电泳条带,判断SNP的突变的情况, 即纯和, 野生纯和,和杂和子。

当没有直接可利用的酶切位点时,可以采用突变引物中个别BASE,从而凑成切点的设计,也叫做RG-PCR, restriction site generation PCR。 B、有经费的实验室的方法:

这里我写几个自己曾经涉足过的方法,可行性比较强, 但是需要相应的经费支持和相应的仪器,但是通量相对更高, 效率更好: 1、直接测序, 基于PCR产物的直接sequencing的方法, 比对序列结果, 就可以进行SNP的识别和分析。

2、分型质谱, 华大生物信息平台那边可以外接服务, 提供PCR产物即可。

3、pyro-sequencing, 微测序, 中科院遗传所 王沥研究员那里有可以联系的外接服务。

4、D-HPLC, 变性高效液相色谱法。 北京可以去联系做的地方不少, 北京大学生科院有机器, 另外北京大学肿瘤研究所也有机器, 国家人类基因组陈标那里也有一台, 需要做的话, 拿着经费和他们联系就可以, 这个方法也很不错, 价钱可以商量。

5、还有些方法,如DNA芯片技术适合对于large scale 的SNP的筛查, 一般用于组学领域, 可能不适用与您的情况。 还有许多如荧光共振能量转移等方法/探针杂交法等,并未在本领域中国内推广, 就不一一介绍了。 1)测序

主要发现新的SNP位点和比较集中的SNP位点,如hla区域,但成本较高,工作量大,不适合大样本做疾病关联分析。

2)taqman探针

结果比较可靠,国外文章也大量应用,不过对于国内成本偏高,同类还有snpshot技术,abi和贝克曼都相应试剂盒。成本和成功率都比taqman要低。 3)snp芯片

国外大规模筛查疾病关联分析常用,illumina和affy都有不同密度的成熟产品,单位点成本很低,但点较多,样本多时也会很高花费,但结果准确,适合复杂疾病,有实力的项目组一般大型机器点在384-群基因组可以订制,但成本会高;illumina开发了一台小的芯片,极其适合1-384,可以订制,成本在2-5元/人点,但还没有很成熟的流程,具体效果和成功率要进一步看。

4)剩下的就是传统方法如酶切,PCR-SSCP等,也有杂志接受,但一般需要测序验证。缺点是工作量太大,结果不准确,不是所有位点都可以做,但成本很低。

目前已有多种方法可用于SNP检测,如根据DNA列阵的微测序法、动态等位基因特异的杂交、寡聚核苷酸特异的连接、DNA芯片以及TaqMan系统等。但不管哪一种方法,首先必须进行靶序列的扩增,然后才能进行其它检测。

传统的SNP检测方法是采用一些已有的成熟技术,如DNA测序、限制性酶切片段长度多态性(RFLP)、单链构象多态性(SSCP)、等位基因特异的寡聚核苷酸杂交(ASO)等。这些技术虽在某种程度上能完成对SNP的检测,但由于它们必须通过凝胶电泳进行检测,因此,距快速、高效、自动化的目标还相差甚远。传统的RFLP只能检测到SNP的一部分,测序技术既费时费力,又不易实现自动化,而且DNA链的二级结构还容易造成人工假相,使测序结果出现偏差,不适宜于SNP的检测;SSCP则很难满足自动化的需要,难以大规模开展工作。因此,这些方法均未被广泛采用。

DNA芯片技术是近年来新开发的一种DNA序列变异检测工具。DNA芯片(DNA chip),也称生物芯片(biochip),其大小与计算机上的CPU芯片相似,约1 cm2或更大些,以玻璃、硅、聚丙烯等作为载体基片,芯片上铺了一层肉眼看不见的DNA纤维“地毯”,即具有特定碱基序列的探针。待测基因经提取后,被切成长短不一的片段,经荧光化学物质标记后,注射到嵌有芯片的载片上。由于DNA和探针杂交的程度与荧光强度相关,因此通过激光扫描,即可根据荧光强弱测出被检测序列的变异。

目前已有多家公司开展了对芯片的研究,例如美国的Affymetrix公司、NEN生命科学公司等。前者曾开发出BRCA1(乳癌基因1号)芯片、p53芯片等,后者则在1张玻璃芯片上集成了多达2400个已知基因。此外,Research Genetics公司新近开发了1个集成有1500个

SNP的DNA芯片,它涵盖了人类基因组全部24条染色体,所提供的信息量至少等于或优于目前常用的300~400个微卫星标记的图谱,检测时只需0.5μg的DNA样品就可进行1次全基因组的扫描。 另外Transgenomic公司的WAVE?核苷酸片段分析系统是高通量且较为准确可靠的筛查未知、已知SNP的新方法。利用Transgenomic公司的WAVE?核苷酸片段分析系统进行SNP检测平均每个样本的费用为$0.5。

4. 当前SNP功能研究主要有以下几方面:

SNP 的分型技术可分为两个时代,一为凝胶时代,二为高通量时代。凝胶时代的主要技术和方法包括限制性酶切片段长度多态性分析(RFLP)、寡核苷酸连接分析(OLA)、等位基因特异聚合酶链反应分析(AS2PCR)、单链构象多态性分析(SSCP)、变性梯度凝胶电泳分析(DGGE),虽然这些技术与高通量时代的技术原理大致一样,但是由于它不能进行自动化,只能进行小规模的SNP分型测试,所以必然会被淘汰。高通量时代的SNP分型技术按其技术原理可分为:特异位点杂交(ASH)、特异位点引物延伸(ASPE)、单碱基延伸(SBCE)、特异位点切割(ASC)和特异位点连接(ASL)5 种方法。此外,采用特殊的质谱法和高效液相层析法也可以大规模、快速检出SNP 或进行SNP 的初筛。近年来已经在晶体上用“光刻法”实现原位合成,直接合成高密度的可控序列寡核苷酸,使DNA 芯片法显示出强大威力,对SNP 的检测可以自动化、批量化,并已在建

立SNP 图谱方面投入实际应用。DNA 芯片法有望在片刻之间评价整个人类基因组。

1)报告基因转染技术:这一技术主要用于研究启动子SNP对于mRNA转录效率,是通过观察转录结局来判断SNP是否具有功能。 2)EMSA技术:通过在体外合成含SNP位点的寡核苷酸与转录因子特异性结合,观察结合的强度和效率,但是该技术由于只人工合成较短长度的寡核苷酸,没有考虑SNP周围遗传背景环境的影响,因此在重复性和说服力上不强。

3)ChiP技术:该技术通过超声将染色体碎片化,再将碎片化的核酸与转录因子的结合,最后通过PCR技术观察判断结合的效率和强度,该技术克服了EMSA的一些缺点,当前做的文献较多。 5 SNP产生功能的机制研究的个人之所见

1.对大多数SNP而言,都由于位于一些非编码区域而不产生明显的功能性影响,此时做SNP功能意义不大。

2.启动子SNP研究是做的人最多的,相关实验技术都比较成熟,其产生功能的机制主要是影响TF与启动子的的结合能力,从而调控基因的转录。

3.编码区SNP有同义和非同义2种,非同义突变由于会导致氨基酸的变化,从而影响蛋白质的功能,特别是发生在结构功能区域的SNP

尤其重要,可是这方面的技术还存在瓶颈,做得相当少,据我所知要用什么诱导点突变的方法再去评价蛋白质功能的。至于非同义突变,虽然没有明显的功能的分子机制,但是在遗传学上可能因为与附近的其它致病基因的表达或者SNP连锁,因此在流行病学上形成阳性结果一般以此解释。

4.内含子区域SNP产生功能的分子机制一般是与附近其它基因SNP连锁或者可能影响mRNA的剪接从而影响蛋白质的功能——很多研究中做INTRON发现有阳性结果解释不了,而且大多只是猜测。 PYRO测序用于SNP基因分型

其实是一种段片段焦磷酸测序技术,在测序引物的引导下,完成段片段(含snp)的测序,从而实现基因分型。缺点:不能检测长片段,对于重复序列没有办法。 原理简介

1.测序引物与单链,PCR扩增的DNA模板相结合。然后将其与DNA聚合酶、ATP硫酸化酶、荧光素酶和三磷酸腺苷双磷酸酶,以及底物APS和荧光素一起孵育。

2.四种dNTP之一被加入反应体系,如与模扳配对,此dNTP与引物的末端形成共价键,dNTP的焦磷酸基团(PPi)释放出来。而且释放出来的Ppi的量与和模板结合的dNTP的量成正比。

3.ATP sulfurylase在adenosine 5′ phosphosulfate存在的情况下催化PPi形成ATP,ATP驱动luciferase介导的Luciferin向oxyluciferin的转化,oxyluciferin发出与ATP量成正比的可见光信号。光信号由CCD摄像机检测并由pyrogram?反应为峰。每个光信号的峰高与反应中掺入的核苷酸数目成正比。

4.TP和未掺入的dNTP由Apyrase降解,淬灭光信号,并再生反应体系。

5.然后加入下一种dNTP。最终待测序列顺序,即可从反应光强的信号峰中读出。在此过程之中有几点值得注意的是,在体系中使用的是dATPS而非dATP,因为dATPS不是荧光素酶的底物,而且DNA聚合酶对dATPS的催化效率更高。而且在系统之中,底物的浓度已经最佳化,使得dNTP的降解速度慢于它的掺入速度,ATP的合成速度快于水解速度,其中三磷酸腺苷双磷酸酶的特异浓度,可以保证降解完全,使系统复原。

Real time PCR检测SNP的方法是:

针对目标基因片段的突变位点,设计两条引物,这两条引物的区别仅仅是末端的1-2个碱基不同,分别与突变位点匹配。共同的下游引物和探针。然后扩增。就可以得到不同的CT值,根据CT值的不同,来确定基因类型。

1 、把蛋白序列对应的核酸序列找到。 2 、根据核酸序列做BLAST (对dbSNP数据库http://www.ncbi.nlm.nih.gov/SNP/snpblastByChr.html)。 3 、结果中,可以得到你的序列上所以已知的SNP。

以编码5-hydroxytryptamine (serotonin) receptor的HTR1A基因为例,先进入entrez,选择gene选项,在NCBI中搜HTR1A基因,到如下图界面,点基因缩略图,然后点graphics。

点击后的界面如下。这里已经很清楚地标明了SNP所在的位置以及对应的核酸与蛋白序列。但有一点要说明,我注意到这个基因编码的蛋白序列与swissprot的序列有一些差别,很可能是收录的版本不同,或是有些序列是NCBI直接根据orf形成的.

1,如果是检测基因的所有已知的SNP,那么首先要去了解并查询到这些SNP位点,SNP位点可以通过查询dbSNP数据库

(http://www.ncbi.nlm.nih.gov/SNP/)和TSC(The SNP Consortium)数据库(http://snp.cshl.org/),可以获知基因及上下游邻近序列的SNP位点。

2,至于挑选的原则,可以介绍一下Hap Map的正规化标准: SNP Selection Criteria Category 1 \

This contains all SNPs for which we have allele frequency or genotyping data. This includes SNPs from the TSC allele frequency project, as well as SNPs characterized by JSNP. These SNPs were generated from those rs clusters in which at least one of the SNPs in the cluster contains genotype or allele frequency data and the minor allele must have been seen in at least two individuals. Category 2 \

These are true double-hit SNPs, produced in collaboration with Jim Mullikin and Sarah Hunt. A double-hit SNP must be seen twice, in two different DNA samples which must have produced two alleles. TSC trace data was only allowed to contribute one hit per allele because the individual source DNA for a trace could not be identified. Category 3 \”

This category contains two groups: SNPs that JSNP certifies are likely to be real based on manual inspection of their data (but have not been genotyped), and SNPs that Perlegen verified independently. Category 4 \

These are SNPs from BAC overlaps that do not fall into category 1 or 2 above

基因芯片与SNP分析

基因芯片技术作为一种新兴的生物技术,近年来得到迅速发展,其应用具有巨大的潜力。单核苷酸多态性(SNP)作为新的遗传标记对基因定位及相关疾病研究的意义亦非常重大。本文主要介绍了DNA 芯片技术的原理和分类、单核苷酸多态性检测方法及DNA 芯片技术在单核苷酸多态性检测方面的应用。

生物芯片技术是90 年代初发展起来的,集分子生物学、微电子技术、高分子化学合成技术和计算机科学等于一身的一门新型技术。目前发展的生物芯片种类繁多, 如蛋白质芯片、基因芯片、激素芯片、药物芯片等。但最初的生物芯片主要用于对DNA 的测序, 基因表达谱的鉴定及基因突变体的检测、分析等方面。迄今为止, 使用最多的也是DNA 芯片。DNA 水平遗传多态性标记至今已经历了3 个阶段:限制性酶切片段长度多态性标记(RFLP)、DNA 重复序列的多态性标记(包括小卫星、微卫星DNA 重复序列)、单核苷酸多态性标记(single nucleotide polymorphisms , SNPs)。

SNP 具有数量多,分布广泛,易于快速、规模化筛查,便于基因分型等特点。伴随着SNP 检测和分析技术的进一步发展,尤其是与DNA 芯片等技术的结合, SNPs 在基因定位中具有巨大优势和潜力, 并为DNA芯片应用于遗传作图提供了基础。由于基因芯片具有携带信息量大和检测方便的特点,使得用DNA 芯片对SNP 进行分析具有广阔的前景。DNA 芯片和SNP 分析已日益成为研究功能

基因组学的工具。 1 、基因芯片

基因芯片的基本原理是应用已知的核苷酸序列作为探针与标记的靶核苷酸序列进行杂交,通过对信号的检测进行定性与定量分析。基因芯片可在一微小的基片(硅片、玻片等)表面集成大量的分子识别探针,能够在同一时间内平行分析大量基因,进行大信息量的检测分析。基因芯片应用很广, 根据所用探针类型不同分为cDNA 微阵列(或cDNA微阵列芯片) 和寡核苷酸阵列(或芯片),根据应用领域不同而制备的专用芯片如毒理学芯片(toxchip)、病毒检测芯片(如肝炎病毒检测芯片)、p53 基因检测芯片等。根据其作用可分为检测基因质和量的芯片。量的检测包括:检测mRNA 水平、病原体的有无及比较基因组基因的拷贝数,既可用寡核苷酸芯片,又可用cDNA 芯片完成,但cDNA 芯片更具优势。质的检测包括:DNA 测序及再测序、基因突变和SNP 检测等,主要用寡核苷酸芯片完成。 巢式PCR-RFLP技术

“巢式PCR-RFLP是针对任意的基因分型技术,使任何位点最终都能进行常规限制性内切酶鉴定;同时该SNP分型技术利用巢式PCR技术,使得多个位点同时进行分析成为可能。即使低浓度的DNA也能够进行快速准确的分型工作。 与现有常规的分型技术相比,其最大的优势包括:

(一)所需DNA浓度低。1-2ng/uL也能完成检测工作,而Taqman技术所需的DNA含量至少5ng/uL。

(二)价格低。由于不需要合成荧光探针,使得该技术比Taqman技术价格低,该优势在对多个位点同时进行分型时更明显。 技术基本原理和实例

采用的巢式PCR-RFLP分型技术,其基本原来是利用PCR引物的3’端,对SNP位点附近的碱基进行人为改造,产生一个常规的限制性内切酶识别序列,如SNP rs1321425(rs1321425-来自NCBI的refSNP数据库)的C/G,其任何一个碱基和上下游碱基无法形成一个可直接被限制性内切酶识别的序列,于是我们对SNP位点前的上游碱基进行改造,通过对序列的分析和PCR效果的计算,我们将原本四个碱基AGAT改成CTGC,结合后一个碱基A以及SNP位点G,形成CTGCAG(PstI)酶切识别位点,经测序和序列对比,改造成功。又比如rs9309462和rs4646642,成功的将2个碱基,3个碱基进行成功的

rs1321425TCACAAAAAATAAAAAATTTTAATTTTAAAGGAGATA C/G

ACAAGAAATGAGCATGTGTGAAAGCAC

TTCTGTAAACTACATGCACTAAT 与Taqman技术和普通技术的详细对比

分型技术 PCR-RFLP技术 Taqman技术 普通PCR-RFLP技术 最佳运用时机 200-600样本,任何DNA多态位点 样本量大于500人份 仅适合含有现成酶切位点的多态位点的分型

试剂投入 低 荧光探针,需3000-4000元。有可能实验失败需重新花钱设计荧光探针。 低

技术的适用性 可适合任何多态位点的分型 基本适合任何多态位点的分型,但有时若干位点不能成功进行试验;当分型位点过于接近也不能用该方法。 仅适合含有现成酶切位点的多态位点的分型,有时出现的是一些稀有酶的酶切位点,导致效率低下或费用昂贵; 结果判断 直观,明确,稳定 间接,每管反应必须加荧光参照ROX,否则结果判断不确定 一般直观,明确;有时酶切位点出现在非主频等位基因上,导致结果判读困难 结果稳定性 稳定 一般 稳定 结果准确性 准确度高 一般 准确度高 样本消耗量 1-2ng 5-10ng 50-100ng

实验耗时 2-3周 由于要定制MGB荧光探针,和预实验,也需要2-3周 2-3周 操作流程

1.基本信息收集具体内容包括客户信息、样本数(case,control)数、位点信息等。

2 位点信息的查询 主要包括:2.1 位点上下游各300bp的确切序列,

基因频度;2.2 有无文献报道证明该位点多态存在于中国人群;2.3 如无上述相关文献,在J-SNP数据库中查询该位点多态是否存在于东亚人群中。为了保证结果的可靠,实验方案设计原则上应以野生型进行酶切鉴定,因此确认snp的频度是非常重要的。

3.样品质控从全部样品中取8%样品,即96个样品中取8个样品,用我们的一对特异的PCR引物进行样品质控,以检测送来样品是否良好。因为客户样品质量是实验成功的关键因素之一,只有客户提供的样品质量可靠稳定,那么结果自然就好。

4.引物设计同时设计AB两套方案,分别以正链和负链为模板设计引物。

5.单管测试进行实验方案可行性尝试,首先要在多种温度,多种Mg离子、多种添加剂加入的情况下进行方案的可行性测试,对于所有单管测试的结果都送去测序,以保证序列的正确性,在实验结果得到确认的基础上,挑选稳定的方案进入中试过程。

6.中试抽取8个样品做小规模批量实验,以模拟和检查批量PCR情况和酶切情况。

7.大规模实验准备将DNA模板按方案进行一次性分板(有冗余),并引入阳性和阴性对照,同时将所有相关的PCR体系进行一次性大规模分装,防止污染。

8.第一板数据先用一板模板进行一轮PCR和酶切,以检验体系和分板的情况。 9.正式实验 相关技术要点

1.实验设计必需保证野生型的被限制性内切酶切开因为对于只有少量突变型的SNP位点,如果突变型被切开,那么所得到的实验结果就是大量没有被酶切开的PCR产物,而这个结果与酶切实验失败的结果非常类似,不易区分,对结果的判读造成很大的麻烦,因此保证了主频碱基被解开,从根本上保证了实验的可靠性。

2.偏向性扩增的解决。所谓偏向性扩增是因为SNP位点上会往往存在嘌吟和嘧啶的替换,在PCR过程中,聚合反应对嘧啶(C或T)比较敏感,使得嘌吟(A或T)的扩增非常少,而出现偏向性扩增,这在SNP位点附近嘌吟含量较高时特别明显。为此,本公司专门设计一个方案,用以克服偏向性扩增。

3.方案设计中的内切酶的选择虽然从理论上,我们的方案可以进行任意位点改造,但事实上在改造过程中会出现一系列的问题,包括扩增效率,碱基划移等一系列问题,使得改造方案失败。对此,我们公司专业开发了一个引物设计软件,通过运算获得最佳的改造方案,同时通过在正向和反向序列上同时设计方案,以保证试验的成功。

4.PCR产物的污染问题在大规模的PCR过程中,最严重的问题是PCR产物污染,据我们经验总结,80%以上的污染是由于接触式污染,剩余的污染则包括气溶胶污染等环境造成的污染。对于PCR污染这个问题,本公司制订了严格的实验措施,具体包括使用滤芯抢头、所有PCR体系全部分装、PCR体系与各类模板严格分离、配置体系人员与接触PCR

产物人员严格分离等一系列措施,同时在处理PCR管,eppendorf管时也规定了详细的操作过程。

5.关于质量控制问题在每板PCR过程中,我们会放入两个阴性对照和一个重复对照,以确认PCR的过程中不会产生污染和PCR的结果确实可信。 RFLP技术 一、 材料

基因组DNA(大于50kb,分别来自不同的材料)。 二、设备

电泳仪及电泳槽, 照相用塑料盆5只,玻璃或塑料板(比胶块略大) 4块,吸水纸若干,尼龙膜(依胶大小而定),滤纸 ,eppendorf管(0.5ml)若干。 三、试剂:

1、限制性内切酶(BamHⅠ, EcoRⅠ, HindⅢ, XbaⅠ)及10×酶切缓冲液。

2、5×TBE电泳缓冲液:配方见第一章。 3、变性液:0.5mol/L NaOH,1.5mol/L NaCl 。 4、中和液:1mol/LTris·Cl, pH7.5/1.5mol/L NaCl 。 5、10×SSC:配方见第九章。

6、其它试剂:0.4mol/L NaOH,0.2mol/L Tris·Cl, pH7.5/2×SSC ,ddH2O,Agarose 0.8%, 0.25mol/L HCl 。 四. 操作步骤

1. 基因组DNA的酶解

(1) 大片断DNA的提取详见基因组DNA提取实验,要求提取的DNA分子量大于50kb, 没有降解。 (2) 在50μl反应体系中,进行酶切反应: 5μg基因组DNA 5μl 10×酶切缓冲液

20单位(U)限制酶(任意一种) 加ddH2 O, 至50μl

(3) 轻微振荡, 离心,37℃反应过夜。

(4) 取5μl反应液,0.8%琼脂糖电泳观察酶切是否彻底,这时不应有大于30kb的明显亮带出现。

[注意] 未酶切的DNA要防止发生降解, 酶切反应一定要彻底。 2. Southern转移

(1) 酶解的DNA经0.8%琼脂糖凝胶电泳(可18V过夜)后EB染色观察。

(2) 将凝胶块浸没于0.25mol/L HCl中脱嘌呤, 10分钟。 (3) 取出胶块, 蒸馏水漂洗, 转至变性液变性45分钟。经蒸馏水漂洗后转至中和液中和30分钟。

(4) 预先将尼龙膜,滤纸浸入水中,再浸入10×SSC中,将一玻璃板架于盆中铺一层滤纸(桥)然后将胶块反转放置,盖上尼龙膜,上覆二层滤纸,再加盖吸水纸,压上半公斤重物, 以10×SSC盐溶液吸印,维持18-24小时。也可用电转移或真空转移。

(5) 取下尼龙膜, 0.4mol/L NaOH 30秒, 迅速转至0.2mol/L Tris·Cl,pH7.5/2×SSC,溶液中, 5分钟。

(6) 将膜夹于2层滤纸内, 80℃真空干燥2小时。 (7) 探针的制备和杂交见第九章分子杂交部分。 [注意] 1、 步骤(2)中脱嘌呤时间不能过长。

2、 除步骤(1)、(4)、(5)外, 其余均在摇床上进行操作。

3、步骤(4)中,当尼龙膜覆于胶上时, 绝对防止胶与膜之间有气泡发生, 加盖滤时也不应有气泡发生。

4、有时用一种限制性内切酶不能发现RFLP的差异,这时应该试用另一种酶

PCR产物的电泳检测时间一般为48h以内,有些最好于当日电泳检测,大于48h后带型不规则甚致消失。 一.假阴性,不出现扩增条带

PCR反应的关键环节有①模板核酸的制备,②引物的质量与特异性,③酶的质量及活性 ④PCR循环条件。寻找原因亦应针对上述环节进行分析研究。

模板:①模板中含有杂蛋白质,②模板中含有Taq酶抑制剂,③模板中蛋白质没有消化除净,特别是染色体中的组蛋白,④在提取制备模板时丢失过多,或吸入酚。⑤模板核酸变性不彻底。在酶和引物质量好时,不出现扩增带,极有可能是标本的消化处理,模板核酸提取过程出了毛病,因而要配制有效而稳定的消化处理液,其程序亦应固定不宜随意更改。

酶失活:需更换新酶,或新旧两种酶同时使用,以分析是否因酶的活性丧失或不够而导致假阴性。需注意的是有时忘加Taq酶或溴乙锭。

引物:引物质量、引物的浓度、两条引物的浓度是否对称,是PCR失败或扩增条带不理想、容易弥散的常见原因。有些批号的引物合成质量有问题,两条引物一条浓度高,一条浓度低,造成低效率的不对称扩增,对策为:①选定一个好的引物合成单位。②引物的浓度不仅要看OD值,更要注重引物原液做琼脂糖凝胶电泳,一定要

有引物条带出现,而且两引物带的亮度应大体一致,如一条引物有条带,一条引物无条带,此时做PCR有可能失败,应和引物合成单位协商解决。如一条引物亮度高,一条亮度低,在稀释引物时要平衡其浓度。③引物应高浓度小量分装保存,防止多次冻融或长期放冰箱冷藏部分,导致引物变质降解失效。④引物设计不合理,如引物长度不 够,引物之间形成二聚体等。

Mg2+浓度:Mg2+离子浓度对PCR扩增效率影响很大,浓度过高可降低PCR扩增的特异性,浓度过低则影响PCR扩增产量甚至使PCR扩增失败而不出扩增条带。

反应体积的改变:通常进行PCR扩增采用的体积为20ul、30ul、50ul。或100ul,应用多大体积进行PCR扩增,是根据科研和临床检测不同目的而设定,在做小体积如20ul后,再做大体积时,一定要模索条件,否则容易失败。

物理原因:变性对PCR扩增来说相当重要,如变性温度低,变性时间短,极有可能出现假阴性;退火温度过低,可致非特异性扩增而降低特异性扩增效率退火温度过高影响引物与模板的结合而降低PCR扩增效率。有时还有必要用标准的温度计,检测一下扩增仪或水溶锅内的变性、退火和延伸温度,这也是PCR失败的原因之一。 靶序列变异:如靶序列发生突变或缺失,影响引物与模板特异性结合,或因靶序列某段缺失使引物与模板失去互补序列,其PCR扩增是不会成功的。 1假阳性

出现的PCR扩增条带与目的靶序列条带一致,有时其条带更整齐,亮度更高。

引物设计不合适:选择的扩增序列与非目的扩增序列有同源性,因而在进行PCR扩增时,扩增出的PCR产物为非目的性的序列。靶序列太短或引物太短,容易出现假阳性。需重新设计引物。 靶序列或扩增产物的交叉污染:这种污染有两种原因:一是整个基因组或大片段的交叉污染,导致假阳性。这种假阳性可用以下方法解决:①操作时应小心轻柔,防止将靶序列吸入加样枪内或溅出离心管外。②除酶及不能耐高温的物质外,所有试剂或 器材均应高压消毒。所用离心管及样进枪头等均应一次性使用。③必要时,在加标本前,反应管和试剂用紫外线照射,以破坏存在的核酸。二是空气中的小片段核酸污染,这些小片段比靶序列短,但有一定的同源性。可互相拼接,与引物互补后,可扩增出PCR产物,而导致假阳性的产生,可用巢式PCR方法来减轻或消除。 2出现非特异性扩增带

PCR扩增后出现的条带与预计的大小不一致,或大或小,或者同时出现特异性扩增带与非特异性扩增带。非特异性条带的出现,其原因:一是引物与靶序列不完全互补、或引物聚合形成二聚体。二是Mg2+离子浓度过高、退火温度过低,及PCR循环次数过多有关。其次是酶的质和量,往往一些来源的酶易出现非特异条带而另一来源的酶则不出现,酶量过多有时也会出现非特异性扩增。其对策有:①必要时重新设计引物。②减低酶量或调换另一来源的酶。③降低引物

量,适当增加模板量,减少循环次数。④适当提高退火温度或采用二温度点法(93℃变性,65℃左右退火与延伸)。 3出现片状拖带或涂抹带

PCR扩增有时出现涂抹带或片状带或地毯样带。其原因往往由于酶量过多或酶的质量差,dNTP浓度过高,Mg2+浓度过高,退火温度过低,循环次数过多引起。其对策有:①减少酶量,或调换另一来源的酶。②减少dNTP的浓度。③适当降低Mg2+浓度。④增加模板量,减少循环次数。 二.PCR污染与对策

PCR反应的最大特点是具有较大扩增能力与极高的灵敏性,但令人头痛的问题是易污染,极其微量的污染即可造成假阳性的产生。 污染原因

(一)标本间交叉污染:标本污染主要有收集标本的容器被污染,或标本放置时,由于密封不严溢于容器外,或容器外粘有标本而造成相互间交叉污染;标本核酸模板在提取过程中,由于吸样枪污染导致标本间污染;有些微生物标本尤其是病毒可随气溶胶或形成气溶胶而扩散,导致彼此间的污染。

(二)PCR试剂的污染:主要是由于在PCR试剂配制过程中,由于加样枪、容器、双蒸水及其它溶液被PCR核酸模板污染.

(三)PCR扩增产物污染:这是PCR反应中最主要最常见的污染问题,因为PCR产物拷贝量 大(一般为1013拷贝/ml),远远高于PCR检测数个拷贝的极限,所以极微量的PCR产物 污染,就可造

成假阳就可形成假阳性。

还有一种容易忽视,最可能造成PCR产物污染的形式是气溶胶污染;在空气与液体面摩擦时就可形成气溶胶,在操作时比较剧烈地摇动反应管,开盖时、吸样时及污染进样枪的反复吸样都可形成气溶胶而污染.据计算一个气溶胶颗粒可含48000拷贝,因而由 其造成的污染是一个值得特别重视的问题.

(四)实验室中克隆质粒的污染:在分子生物学实验室及某些用克隆质粒做阳性对照的检验室,这个问题也比较常见。因为克隆质粒在单位容积内含量相当高,另外在纯化过程中需用较多的用具及试剂,而且在活细胞内的质粒,由于活细胞的生长繁殖的简便性及具有很强的生命力,其污染可能性也很大。污染的监测

一个好的实验室,要时刻注意污染的监测,考虑有无污染是什么原因造成的污染,以便采取措施,防止和消除污染。

本实验的关键步骤是获得适当的抗体-DNA复合物。用链亲和素将生物素标记的抗体与生物素标记的DNA偶联的方法,因每个链亲和素分子可与四个生物素分子结合,因此要优化反应条件,以使得每个链亲和素分子既能结合上抗体分子,又能结合上DNA。

此外,还可用化学方法将DNA与抗体分子共价偶联,即将抗体分子和5’端氨基酸修饰的DNA分别用不同的双功能偶联剂激活,然后通过自发的反应偶联到一起,比如,用N-Succinimidyl-S-acetyl thioacetate(SATA)活化氨基修饰的DNA,用Sulfo-Succinimidyl 4-(maleimidomethyl)

Cyclohexane-1-Carboxylate(Sulfo-SMCC)修饰抗体分子,然后将二者在一小管中混合,通过加入盐酸胲(Hydroxylamine hydrochloride)使二者偶联在一起。

免疫PCR具有高敏感性。因此,抗体和标记DNA的任何非特异性结合均可导致严重的本底问题。因而在加入抗体和标记DNA后必须尽可能彻底地清洗。即使有些特异性结合的抗体或标记DNA被洗掉了,亦可在最后通过增加PCR的循环次数得到弥补。此外,应用有效的封闭剂对防止非特异性结合也是非常重要的。可用脱脂奶粉和牛血清白蛋白做蛋白封闭剂,用鱼精DNA做核酸封闭剂。防止本底信号的另一个重要因素是控制污染,这也是所有敏感的检测系统存在的问题。即使每一步试验都做得非常认真,重复使用同样的引物和标记DNA均会产生假阳性信号。

免疫PCR的一个优点是标记DNA序列完全是人为选定。因此标记DNA及其引物可经常变换,以避免由于污染造成的假阳性信号。

免疫PCR可以检测到常规免疫学方法无法检测的样品。因此,应用免疫PCR可在微观水平(单细胞)检测抗原,定量PCR产物可以估计某一标本中的抗原数量,在临床诊断中可在疾病早期抗原量很低时检测到微量的抗原。

(1)免疫PCR的优化策略——新型连接分子的出现 1)叶绿素分子和链酶卵白素

乔生军等用自然界普遍存在的叶绿素分子(chlorophy)作

为共价连接蛋白与核酸的中间分子,构建了甲胎蛋白(AFP)抗体的基因探针,此探针人为地把抗体直接锚定在双链DNA分子上,复合分子性质均一稳定,室温至少保存6个月,大大简化了中间步骤,降低了成本,使免疫PCR更易推广。也有人用链酶卵白素将生物素化的抗体与生物素化的DNA分子直接连接,也得了良好的较果。 2)双特异融合蛋白

任军将编码单链抗体和链亲和素融合蛋白的基因插入载体在大肠杆菌中进行表达,获得了具备结合生物素和抗原分子的双特异性融合蛋白,可直接连接抗体和生物素化的DNA分子。该融合蛋白可利用工程菌大量制备,性质优良,价格低廉。 3)生物素化F(ab′)2段代替生物素化单抗

抗体的Fab或F(ab′)2易于标记,且因缺乏Fc段大大降低了非特异性吸附的可能性,使免疫PCR的本底大为降低。Yashito用胃蛋白酶消化单抗,把得到的Fab段用生物素标记,以此来检测ANP,使其特异性大为提高。 (2)免疫-PCR的改进

虽然Sano等人构建的免疫-PCR具有极高的灵敏度,但Sano所用的连接分子链亲和素-蛋白A嵌合体还没有商品化,因此限制了它在实际应用中的广泛普及。Ruzicka等人以生物素化的抗体取代Sano免疫-PCR系统中的抗体,用商品化的亲和素代替链亲和素-蛋白A嵌合体作为连接分子构建了一个新的免疫-PCR系统。Ruzicka用此免疫-PCR系统检测小鼠抗载脂蛋白E抗体。可

以检测出包被浓度为10fg/ml的E抗体。此外,Sano的免疫-PCR实验流程需要众多的洗涤步骤,使实验过程相当繁琐,并需要大量的操作时间。Zhou等人对此作了改进,他们用生物素化的二抗和游离链亲和素作为连接分子进行免疫-PCR实验,把每个步骤的洗涤次数从原先的7~15次减至3~5次,从而减少了操作时间,但不影响实验结果的准确性。另外,用修饰过的抗原稀释缓冲液(modified antigen dilution buffer, MADB)代替Sano免疫-PCR中的TBS作为抗原稀释液,它主要把TBS中胍的浓度调到2M,由此解决了抗原的溶解问题。Zhou检测了人原癌基因ETSI,检测浓度可达到9.6×10-15M,是常规ELISA的105倍。与Sano的免疫-PCR系统相比,Ruizicka和Zhou所用的方法不需要特殊的试剂,生物素和亲和素(链亲和素)都已经商品化,因此在实际操作中得到广泛应用。但直接包被待检抗原不适用于临床标本和难以吸附固相抗原的检测。随后在一系列实验中建立了各种夹心免疫-PCR,扩大了检测范围。然而亲和素(链亲和素)作为一个连接分子对生物素的结合具有4价特性,亲和素与生物素化DNA结合可得到5种不同产物,即游离亲和素、结合饱和亲和素和部分饱和亲和素才能在检测过程中发挥作用,游离亲和素与固相中生物素化抗体结合会降低方法的敏感性。

(3)免疫-PCR新技术——多分析物免疫-PCR

在以上的免疫-PCR实验中,生物素化的DNA通过不同的生物素结合试剂(链亲和素、亲和 素)连接到生物素化的抗体上。这

样,DNA标记和抗体就被组装在同一位点上,因此可能产生可变的化学计量。另外它需要额外的步骤加入生物素试剂和连接试剂,并需要众多的洗涤步骤去除过量的试剂和非特异性连接试剂的实验组分,作为一个免疫-PCR实验就相当复杂且需要相当多的操作时间。Hendrickson等人用异双功能化学交联剂预先连接好抗体和ssDNA标记,形成标记DNA-抗体偶联物。特别是,他将不同的抗体标上特异的DNA序列,形成一种新的、基于双抗夹心免疫模式的免疫-PCR,并可同时检测多种抗原,避免了免疫实验敏感性的限制和在一个实验中检测抗原的种类。而且,免疫-PCR夹心模式可以用常规的免疫实验完成。这样就大大降低了原先免疫-PCR实验的复杂性,并减少了大量的操作时间。这种免疫-PCR系统的关键改进就是用异双功能化学关联剂制备标记DNA-抗体偶联物。制备过程如下: 1) 氨基修饰寡核苷酸与SATA反应,形成乙酰硫代乙酰修饰DNA。

2) Sulfo-SMCC与抗体反应,形成马来酰亚胺修饰抗体。 3) 混合马来酰亚胺修饰抗体和乙酰硫代乙酰修饰DNA,并加入羟胺盐酸,在黑暗条件下反应,使抗体和标记DNA偶联。 4) 反应混合物用HPLC凝胶过滤纯化偶联物,收集的偶联物在4℃下保存。

在这偶联物中,ssDNA是连在抗体的Fc段上,因此并不影响抗体的活性。Hendrickson用此方法把设计独特的三种寡核苷酸(分别为55、85、95个碱基)分别共价连接到三种分析物hTSH、

hCG、β-Gal的特异性抗体上,每一个寡核苷酸标记物含有相同的引物序列。这样,一对引物就可以促成三种DNA的共同扩增,Hendrickson用预先制备好的三种抗体-RNA偶联物同时检测hTSH、hCG、β-Gal实验使用双抗夹心模式。实验结果表明,分析物检测的敏感度超过普通ELISA约三个数量级。

由于化学合成寡核苷酸标记物序列长度不能超过100个碱基。因此,在多分析物免疫-PCR实验中,ssDNA标记物和引物的设计就受到了限制。Joerger等人用dsDNA作为标记物与抗体偶联。几千个bp的dsDNA可以通过生物学和生物化学方法制备。Joerger通过PCR和单向缺失在以Puc18为基础的重组质粒上制备了各种长度、具有相同引物序列的的dsDNA,选择适合长度的dsDNA作为特异性抗体的标记物。另外,在免疫-PCR实验中,dsDNA比ssDNA具有更多的优越性。DsDNA中的一条链跟抗体的Fc段连接,另一条链在PCR第一步变性步骤中就释放到溶液中,使链复制没有空间位阻。而且dsDNA比ssDNA具有更高的稳定性。此外,长链DNA分子更容易用荧光标记和光吸收检测,并且可以引入更多的非同位素标记,序列长度的提高可以促进杂合检测。

PCR反应中的主要成份

1. 引物:PCR反应产物的特异性由一对上下游引物所决定。引物的好坏往往是PCR成败的关键。引物设计和选择目的DNA序列区域时可遵循下列原则:(1) 引物长度约为16-30bp, 太短会降

低退火温度影响引物与模板配对,从而使非特异性增高。太长则比较浪费,且难以合成。(2) 引物中G+C含量通常为40%-60%,可按下式粗略估计引物的解链温度 Tm=4(G+C)+2(A+T).(3) 四种碱基应随机分布,在3'端不存在连续3个G或C,因这样易导致错误引发。(4) 引物3'端最好与目的序列阅读框架中密码子第一或第二位核苷酸对应, 以减少由于密码子摆动产生的不配对。(5) 在引物内, 尤其在3'端应不存在二级结构。(6) 两引物之间尤其在3'端不能互补, 以防出现引物二聚体, 减少产量。两引物间最好不存在4个连续碱基的同源性或互补性。 (7) 引物5'端对扩增特异性影响不大, 可在引物设计时加上限制酶位点、核糖 体结合位点、起始密码子、缺失或插入突变位点以及标记生物素、荧光素、地高辛等. 通常应在5'端限制酶位点外再加1-2个保护碱基。(8) 引物不与模板结合位点以外的序列互补。所扩增产物本身无稳定的二级结构, 以免产生非特异性扩增,影响产量。 (9) 简并引物应选用简并程度低的密码子, 例如选用只有一种密码子的Met, 3'端应不存在简并性。否则可能由于产量低而看不见扩增产物。

一般PCR反应中的引物终浓度为0.2-1.0μmol/L。引物过多会产生错误引导或产生引物二聚体, 过低则降低产量。利用紫外分光光度计, 可精确计算引物浓度, 在1cm光程比色杯中,260nm下,引物浓度可按下式计算: X mol/L= OD260/

A(16000)+C(70000)+G(12000)+T(9600)

X: 引物摩尔浓度,A、C、G、T: 引物中4种不同碱基个数。 2. 4种三磷酸脱氧核苷酸(dNTP):dNTP应用NaOH 将pH调至7.0,并用分光光度计测定其准确浓度.dNTP原液可配成5-10mmol/L并分装,-20℃贮存。一般反应中每种dNTP的终浓度为20-200μmol/L。理论上4 种 dNTP各20μmol/L,足以在100μl反应中合成2.6μg的DNA。当dNTP终浓度大于50mmol/L时可抑制Taq DNA聚合酶的活性.4种dNTP的浓度应该相等,以减少合成中由于某种dNTP的不足出现的错误掺入。 3. Mg2+:Mg2+浓度对Taq DNA聚合酶影响很大,它可影响酶的活性和真实性,影响引物退火和解链温度, 影响产物的特异性以及引物二聚体的形成等。通常Mg2+ 浓度范围为

0.5-2mmol/L.对于一种新的PCR反应,可以用0.1-5mmol/L的递增浓度的Mg2+ 进行预备实验,选出最适的Mg2+浓度。在PCR反应混合物中, 应尽量减少有高浓度的带负电荷的基团, 例如磷酸基团或EDTA等可能影响Mg2+ 离子浓度的物质,以保证最适Mg2+ 浓度。

4. 模板:PCR反应必须以DNA为模板进行扩增, 模板DNA可以是单链分子,也可以是双链分子,可以是线状分子,也可以是环状分子(线状分子比环状分子的扩增效果稍好).就模板DNA而言,影响PCR的主要因素是模板的数量和纯度.一般反应中的模板数量为102 -105 个拷贝,对于单拷贝基因,这需要0.1μg的人基因组DNA,10ng的酵母DNA,1ng的大肠杆菌DNA.扩增多拷贝序列

时,用量更少.灵敏的PCR可从一个细胞,一根头发,一个孢子或一个精子提取的DNA中分析目的序列.模板量过多则可能增加非特异性产物.DNA中的杂质也会影响PCR的效率(51protocol.com)。 5. Taq DNA聚合酶:一般Taq DNA聚合酶活性半衰期为92.5℃ 130min,95℃ 40min, 97℃ 5min.现在人们又发现许多新的耐热的DNA聚合酶,这些酶的活性在高温下活性可维持更长时间.Taq DNA聚合酶的酶活性单位定义为74℃下,30min,掺入10nmol/L dNTP到核酸中所需的酶量.Taq DNA聚合酶的一个致命弱点是它的出错率,一般PCR中出错率为2×10-4 核苷酸/每轮循环,在利用PCR克隆和进行序列分析时尤应注意.在100μl PCR反应中,1.5-2单位的Taq DNA聚合酶就足以进行30轮循环.所用的酶量可根据DNA、引物及其它因素的变化进行适当的增减.酶量过多会使产物非特异性增加,过少则使产量降低.反应结束后,如果需要利用这些产物进行下一步实验,需要预先灭活Taq DNA聚合酶, 灭活Taq DNA聚合酶的方法有:(1) PCR产物经酚:氯仿抽提,乙醇沉淀。 (2) 加入10mmol/L的EDTA螯合Mg2+ 。 (3) 99-100℃加热10min.目前已有直接纯化PCR产物的Kit可用。

6. 反应缓冲液:反应缓冲液一般含10-50mmol/L Tris?Cl (20℃下pH8.3-8.8), 50mmol/L KCl和适当浓度的Mg2+ . Tris?Cl在20℃时pH为8.3-8.8,但在实际PCR反应中,pH为6.8-7.8. 50mmol/L的KCl有利于引物的退火.另外,反应液可加

入5mmol/L的二硫苏糖醇(DDT)或100μg/ml的牛血清白蛋白(BSA),它们可稳定酶活性,另外加入T4噬菌体的基因32蛋白则对扩增较长的DNA有利.各种Taq DNA聚合酶商品都有自己特定的一些缓冲液。 SSCP的原理:

单链DNA段呈复杂的空间折叠构象,这种立体结构主要是由 其内部碱基配对等分子内相互作用力来维持的,当有一个碱基发生改变时,会或多或 少地影响其空间构象,使构象发生改变,空间构象有差异的单链DNA分子在聚丙烯酰 胺凝胶中受排阻大小不同.因此,通过非变性聚丙烯酰胺凝胶电泳(PAGE),可以非常 敏锐地将构象上有差异的分子分离开.作者称该方法为单链构象多态性 (Single-Strand Conformation Polymorphism,SSCP)分析.用PCR-SSCP法检测小于200bp的PCR产物时,突变检出率可达70%-95%,片段大于400bp时,检出率仅为50%左右,该法可能会存在1%的假阳性率。应用PCR-SSCP法应注意电泳的最佳条件,一般突变类型对检测的灵敏度无大的影响,同时该法不能测定突变的准确位点,还需通过序列分析来确定。Sarkar等认为对于大于200bp的片段,用其RNA分子来做SSCP会提高其录敏度。检测的基因包括多种癌基因及抑癌基因,也是检测抑癌基因p53突变最常用的方法,仅检测第5-8外显子即可发现85%以上的p53基因突变。由于该法简便快速,特别适合大样本基因突变研究的筛选工作。随着分子生物学技术的发展,检测基因结构和突变的方法不断涌现。尤其是PCR技术问世以后,各种与PCR

相结合的基因检测技术进一步推动了基因研究的发展。如不对称PCR产物的直接测序、核糖核酸酶酶切法(Ribonuclease cleavage,RNAase)、限制性片段长度多态性分析(Restriction Fragment Length Polymorphism,RFLP)等等已成为基因分析的有力工具.但这些方法操作比较繁琐,局限性较大,或要求实验条件高,不适合一般临床实验室使用.1989年问世的PCR-SSCP(下文称SSCP)作为检测基因突变的方法,经不断地改进和完善,更为简便、快速、灵敏,不但用于检测基因点突变和短序列的缺失和插入,而且还被用于DNA定量分析,监测PCR诊断实验中的交叉污染情况,以及传染源的调查等.由于SSCP的突出的优点,近几年被大量地应用.

基本过程:①PCR扩增靶DNA;②将特异的PCR扩增 产物变性,而后快速复性,使之成为具有一定空间结构的单链DNA分子;③将适量的单 链DNA进行非变性聚丙烯酰胺凝胶电泳;④最后通过放射性自显影、银染或溴化乙锭显 色分析结果.若发现单链DNA带迁移率与正常对照的相比发生改变,就可以判定该链构 象发生改变,进而推断该DNA段中有碱基突变.

该方法简便、快速、灵敏,不需要特 殊的仪器,适合临床实验的需要.但它也有不足之处.例如,只能作为一种突变检测方 法,要最后确定突变的位置和类型,还需进一步测序;电泳条件要求较严格;另外,由 于SSCP是依据点突变引起单链DNA分子立体构象的改变来实现电泳分离的,这样就可 能会出现当某些位置的点突变对单链DNA分子立体构象的改变不起作用或作用很小 时,再加上其他条件

的影响,使聚丙烯酰胺凝胶电泳无法分辨造成漏检.尽管如此,该方法和其他方法相比仍有较高的检测率.首先,它可以发现靶DNA段中未知位置的碱 基突变.Takao,经实验证明小于300bp的DNA段中的单碱基突变,90%可被SSCP发 现,他认为现在知道的所有单碱基改变绝大多数可用该方法检测出来.另外,SSCP方 法可通过聚丙烯酰胺凝胶电泳将不同迁移率的突变单链DNA分离,并且还可以进一步 提纯.用这种方法可以最终从DNA序列水平上鉴别突变DNA段. SSCP的改进:

SSCP技术自创立以来,经历了自身发展和完善的过程,刚建立时是将同位素掺入PCR 扩增物中,通过放射自显影来显示结果.这给该技术的推广造成一定的困难,随着DNA 银染方法与PCR-SSCP结合,尤其是直接溴乙锭染色方法的应用,使得该方法大大简化.最近,SSCP值得注意的改进是将DNA-SSCP分析,改为RNA-SSCP分析,其基本原理是: RNA有着更多精细的二级和三级构象,这些构象对单个碱基的突变很敏感,从而提高 了检出率,其突变检出率可达90%以上.另外,RNA不易结合成双链,因此可以较大量 的进行电泳,有利于用溴化乙锭染色.但该方法增加了一个反转录过程;还需要一个较长的引物,内含有启动RNA聚合酶的启动序列,从而相对地增加了该方法的难度.?为了进一步提高SSCP的检出率,可将SSCP分析与其它突变检测方法相结合.其中与杂 交双链分析(Heterocluplex analysis,Het)法结合可以大大提高检出率.Het法是用 探针与要检测的单链DNA或RNA进行杂交,含有一对碱基对错配的杂交链可以

和完全互 补的杂交链在非变性PAG凝胶上通过电泳被分离开.对同一靶序列分别进行SSCP和Het 分析可以使点突变的检出率接近100%,而且实验简便. 试验准备: 变性上样缓冲液 95% 甲酰胺 5mmol/L EDTA 0.05% 溴酚蓝 0.03% 二甲苯晴蓝 0.5×突变凝胶 6% 聚丙烯酰胺凝胶 10% 甘油 0.6% TBE 0.05% 过硫酸铵

0.005% TEMED(N,N,N’,N’-四甲基二胺) 10%醋酸固定液 去离子水

PCR-SSCP的实验操作:

在小于1Kb长度的情况下,DNA段长度与丙烯酰胺的浓度选择如下:

DNA段长度(核苷酸数) 丙烯酰胺(%)

1Kb~700b 3.5 700b~500b 5 500b~200b 8 200b 12

在进行SSCP前首先要通过PCR扩增出特异性好的产物(琼脂糖电泳不能有过强的拖尾).

1、 制备聚丙烯酰胺凝胶(PAG) :制作所需的胶液,将梳子插入模子,从梳子一端加入胶,当胶液快到梳齿时,使 模子向加胶端倾斜,继续慢慢加胶,边加边放端模子以防止气泡形成,室温放置1h使 之凝固.然后拔掉梳子,顶部加入1×TBE封闭,备用。 2、 变性:取10μlPCR产物,加入10μl变性剂(95%甲酰胺,10mmol/LEDTA,0.02%溴酚蓝)、30μl 石蜡油,煮沸5min,取出立刻放入冰浴中2min以上。

3、 电泳 :将水相全部上样,10-15℃下 电泳.开始在300V电压下电泳5min,然后在120V电泳8h,取下凝胶,将其浸在含 0.5ug/ml溴化锭的1×TBE缓冲液中染色30--45min,在紫外灯下观察,或进行银染。

4、 电泳结果检测:将PAG板用去离子水洗二次,浸入10%乙醇和0.5%冰醋酸溶液固定6min.用去离子水洗 二次,再浸入0.2%AgNO3溶液中10min.用去离子水洗3--5次,然后浸入1.5%NaOH和 0.4%甲醛溶液中显色7min.最后,用0.75%NaCO3终止显色。

5、 结果判定:根据不同泳道DNA数目和位置,确定样品扩增产物的PCR-SSCP谱型。根据位置的差异分析判断产物单链构型的差异,从而间接反映模板DNA序列间的差异。 SSCP注意的事项

SSCP是一种快速、简便、灵敏的检测基因突变的方法,为了使SSCP达到最佳效果,应 注意下列事项.

①重复性.影响SSCP重复性的主要因素为电泳的电压和温度.这两个条件保持不变, SSCP图谱可保持良好的重复性.一般SSCP图谱是二条单链DNA带,但有时有的DNA段 可能只呈现一条SSDNA带,或者三条以上,这主要是由于两条单链DNA之间存在相似的 立体构象.有时三条以上的SSCP图谱是由于野型DNA段和突变型DNA段共同存在的 结果.

②靶DNA序列长度的影响在实验中发现SSCP对短链DNA或RNA的点突变检出率要比长链 的高,这可能是由于长链DNA和RNA分子中单个碱基的改变在维持立体构象中起的作用 较小的缘故.而有人认为在DNA链较短的(400bp以下)情况下,DNA的长度不会影响SSCP 的效果.他们仔细选择了实验条件,发现354bp的DNA中点突变的检出率仍可达到90%以 上. ③电泳电压和温度的影响:为了使单链DNA保持一定的稳定立体构象,SSCP应在较低温 度下进行(一般4℃-15℃之间).在电泳过程中除环境温度外,电压过高也是引起温度 升高的主要原因,因此,在没有冷却装置的电泳槽上进行SSCP时,开始的5min应用

较 高的电压(250V),以后用100V左右电压进行电泳.这主要是由于开始的高电压可以使 不同立体构象的单链DNA初步分离,而凝胶的温度不会升高.随后的低电压电泳可以使 之进一步分离.在实验中应根据具体实验条件确定电泳电压.

④DNA段中点突变的位置对SSCP的影响点突变在DNA和RNA中的位置对SSCP检测率的 影响,取决于该位置对维持立体构象作用的大小,而不是仅仅取决于点突变在DNA链 上的位置(有人认为点突变在DNA链中部要比在近端部容易被SSCP检测出来).White曾 设计了一组样品DNA段,并将其中的点突变设在DNA链的中部,而且该点又正处在发 夹结构顶端的环上,结果发现SSCP只能检测出9个样品中的2个(检出率为22%),说明 DNA链中任何部位的突变,只要对其单链立体构象没有影响,都有可能被漏检.

⑤SSCP的结果断定:由于在SSCP分析中非变性PAG电泳不是根据单链DNA分子和带电量 的大小来分离的,而是以单链DNA段空间构象的立体位阻大小来实现分离的,因 此,这种分离不能反映出分子量的大小.有时正常链与突变链的迁移率很接近,很难 看出两者之间的差别.因此一般要求电泳长度在16--18cm以上,以检测限为指标来判 定结果.检测限是指突变DNA段与正常DNA段可分辨的电泳距离差的最小值.大于检 测限则判定链的迁移率有改变,说明该DNA序列有变化,小于检测限则说明链之间无 变化.例如,一般检测限定为3mm,那么当两带间距离在3mm以上,则说明

两链之间有 改变.另外检测限不能定的太低,否则主观因素太大,易造成假阳性结果.另外,SSCP 分析中其它条件,如PCR产物的上样量,PAG的交联度、以及胶的浓度等,都应根据具 体实验进行选择确定.总之,SSCP分析法是一种快速、简便、灵敏的突变检测方法, 适合临床实验室的要求.它可以检测各种点突变,短核苷酸序列的缺失或插入.随着 SSCP分析不断完善,它将成为基因诊断研究的一个有力工具.

PCR-SSCP和RTPCR-SSCP的区别:

仅仅是扩增的方法不同而已,一个是普通的PCR,一个是RTPCR.如果需要鉴定染色体的DNA序列有无差别或基因突变,可以用PCR-SSCP, ,只要有一个核苷酸的区别,变性SDS-PAGE后,条带就会有很大的区别.而RTPCR-SSCP 检测的是cDNA段有无区别的实验。需要注意的是SSCP技术通常用到银染显色,非常敏感 ,实验时对水的要求很高,否则胶的背景很暗,结果不明显,同时,实验过程中务必戴上干净的手套后,才能接触胶,否则会有明显的银染指纹。有时候,限制性酶切分析(RFLP,restriction enzyme length polymorphism)可替代SSCP进行检测基因的差异当然,最后都要以来测序来确定序列. SSCP的应用

自从Orita等用SSCP进行人类DNA多态性分析以来,该方法大量地用于检测和肿瘤发生 有关的基因突变,例如检测星形细胞瘤、脑瘤、小细胞肺癌、胃癌、肠癌等肿瘤中的 p53基因的突变、

肺癌的ras基因突变等.最近Sugano等用银染色SSCP法,成功地检测 了c-Ki-ras2基因第12位的突变,电泳和银染色过程在2.5小时内完成.SSCP还用于检 测引起人类遗传性疾病的研究上,如在囊性纤维化中起作用的CFTR基因、神经纤维瘤 1型基因、家族性结肠息肉基因的研究中.最近,Sharkar等用RNA-SSCP法检测了28名B 型血友病患者的凝血因子IX的基因序列,并与DNA-SSCP和直接基因测序法进行了比 较,发现在全长2.6kbp的凝血因子IX基因组中,有20处碱基点突变,RNA-SSCP可检测 出其中的70%,而DNA-SSCP只能检测出35%,显示了RNA-SSCP比DNA-SSCP有更高的灵敏 性.

SSCP法除大量地用于基因突变的检测外,还用于病毒的分型、监测PCR实验中的污染 情况、以及病原体传播途径的研究中.Yap用巢式PCR对来自不同国家和地区的HBV标品 进行了检测,并对扩增产物进行了SSCP分析,发现每个标本的SSCP图谱完全不同,不 仅证明了HBVDNA具有地区性变异,而且排除了交叉性污染的可能性,为保证PCR诊断 结果的可靠性找到了好方法.另外,Yap等还将SSCP用于DNA定量分析上,他们将SSCP 与竞争性PCR法相结合进行乳腺癌细胞突变p53基因的定量分析,并取得了初步成功. 该方法的优点在于,内标和待测DNA只有一个碱基不同,这样使内标和待测DNA有相同 的扩增条件,从而更准确地测出DNA的量.从以上可以看出,SSCP正在分子生物学领域 发挥着巨大的作用.

1、SNPs检测技术的进展

随着分子生物学技术的飞跃发展, SNPs基因分型技术和方法不断涌现。虽然经典的一些检测SNPs的技术,如限制性片段长度多态性(restriction fragment length polymorphism, RFLP)和单链构象多态性(single-strand conformation

polymorphism, SSCP)等技术仍在实践中广泛使用,但一些高灵敏度、高通量的基因分型方法日益受到重视,这些检测技术包括:TaqMan探针法、SNPlex基因分型法、连接酶检测反应法(ligase detection reaction, LDR)、焦磷酸测序法、DNA芯片/阵列分析法、微球法(Illumina),以及质谱分析和温控高效液相色谱法,可以满足大样本及多SNPs位点的基因分型要求。 2、人类基因组单体型图

虽然人类基因组SNPs数量众多,但是染色体上相邻SNPs的等位位点倾向于以一个整体遗传给后代,这些位于染色体上某一区域的一组相关联的SNP等位位点被称作单体型(haplotype)。大多数染色体区域只有少数几个常见的单体型(每个具有至少5%的频率),它们代表了一个群体中的大部分多态性。一个染色体区域可以有很多SNP位点,但是少数几个标签SNPs(TagSNPs)就能够提供该区域内大多数的遗传多态模式。人类基因组单体型计划通过对约100万个SNPs进行基因分型,拟构建人类DNA序列中多态位点的常见模式。人类基因组单体型图谱的逐渐绘制完成,提供了详尽

的人类DNA序列的变异信息,对人类个体遗传背景的研究提供了强大的机遇和挑战。 3、生物信息学的发展

在功能基因组时代,不断产生的海量信息极大的促进了生物信息学这一新兴学科的发展。各大生物信息数据库存在的基因组全序列信息为SNPs的研究提供了极大的便利:例如通过再测序手段对SNPs的存在及频率信息进行确定,对不同人群进行SNPs的基因分型都需借助这些序列信息才能得以进行;同时,针对SNPs进行连锁分析、单体型构建以及标签SNPs寻找的生物信息软件也不断推出;而且,功能基因组学的发展甚至开始尝试对SNPs进行功能学预测,比如预测启动子SNPs位点与转录因子结合的改变,编码区SNPs对蛋白质的空间结构,生物功能的影响等,这对我们在浩繁的人类SNPs中选择潜在功能性的SNPs位点进行研究具有极大的帮助。 4、从SNPs的关联研究到功能学探讨

随着SNPs检测技术的进展,SNPs在人群中的检测日益得到广泛应用,特别是对于当前多基因复杂疾病如肿瘤、冠心病的遗传易感性的探讨,传统的以家系为基础的连锁分析在检测能力上已经有了明显的局限性,而病例-对照等易于开展的关联性研究方法有显著的优势。因此,近几年探讨SNPs作为复杂性疾病的遗传标记的关联性研究大量涌现。但是即使对于同一SNP位点与相同疾病的关联性研究,

不同研究中心的结果往往也存在很大差异甚至完全相反];而且,与疾病具有显著关联的SNPs到底是发挥功能性作用,或者仅仅是与功能性SNPs相连锁的遗传标记失甚至二者只是某种联系上的假象,这都需要进行功能学研究来加以证实。预计引起细胞功能学改变的SNPs在人类所有SNPs中只占极小一部分(约五万到二十五万个SNPs),大多仅仅在疾病发生过程中介导低度或中度的效果,主要包括分布在基因启动子区域可能发挥调节转录效应的SNPs(regular SNPs, rSNPs)和蛋白质编码区域引起编码氨基酸改变的SNPs(非同义SNPs或错义SNPs)。

当前分子生物学技术的进展推动了SNPs功能学研究的深入,如比较成熟的对于启动子区域SNPs功能学研究技术包括: ①报告基因转染技术,这一技术主要用于研究启动子SNPs对于mRNA转录效率的影响, 通过观察转录结局来判断SNPs是否具有功能。

②凝胶迁移滞后实验(electrophoretic mobility shift assays, EMSA),该技术通过在体外合成含SNPs位点的寡核苷酸与转录因子特异性结合,观察二者结合的强度和效率,但是该技术由于只是人工合成较短长度的寡核苷酸,没有考虑SNPs位点周围遗传背景环境的影响。

本文来源:https://www.bwwdw.com/article/utj5.html

Top