SNP分析原理方法及其应用090228

advertisement
SNP分析原理方法及其应用
卢大儒
复旦大学生命科学学院
遗传工程国家重点实验室
遗传分析内容

基因组:
染色体水平
DNA水平
基因突变 重复, 缺失, 倒位,重排
甲基化 基因组不稳定
多态性: SNP STR, CNV
SNPs(single nucleotide polymorphisms)

概 念 :指在 基 因组水 平 由 单个 核 苷酸的 变 异 所引 起 的
DNA序列多态性。它是人类可遗传的变异中最常见的一
种,占所有已知多态性的90%以上。

SNP在人类基因组中广泛存在,平均每500-1000个碱基对
中即有1个,人类30亿碱基中大约有1000万个SNPs。

人类一般为二等位基因(Biallelic)。二等位基因有四
种不同类型,包括一种转换C>T (G>A)和三种颠
换C>A (G>T)、C>G(G>C)、T>A(A>T)。
...C C A T T G A C...
…G G T A A C T G...
...C C A T T G A C...
…G G T A A C T G...
...C C A T T G A C...
…G G T A A C T G...
...C C G T T G A C...
…G G C A A C T G...
...C C G T T G A C...
…G G C A A C T G...
...C C G T T G A C...
…G G C A A C T G...
wt/wt
wt/m
m/m
DNA序列上单个碱基对的置换、插入或缺失而引起可以遗传的基因结构的变化
突变(Gene Mutation)
<0.1%
生殖细胞或体细胞
单核苷酸多态(SNP)
1-50%
生殖细胞
SNPs的研究意义
1. SNPs作为第三代遗传标记(已知性、可
遗传性、可检测性),用于疾病基因的定
位、克隆和鉴定。___ 路标的作用
传统研究策略(表征、蛋白、基因)
逆向遗传学 (表型、基因、蛋白)
基因定位:从400个STR到500KSNP芯片
连锁分析基因诊断
2.基因多态性与性状表型研究
研究SNPs 本身对机体的影响
生理特征、病理外界环境条件下的千差万别
个体识别,疾病易感;
能力; 性格; 喜好
药物治疗; 环境适应
生物进化,民族区分
SNP的特征







1
2
3
4
5
6
7
单核苷酸变异;
常见 2 等位基因变化;
很稳定, 回复突变极低;
普遍存在, 分布广泛, 均匀
存在SNP高变区域和热点
功能相关, 温和变; 联合作用
SNP连锁单倍型, 标签SNP
2002年人类基因组计划
(HGP草图绘制已经成功,功
能基因组研究将为疾病的预
防,诊断和治疗奠定基础。
从HGP 到HapMap


HapMap计划通过对亚、非、欧裔共269个个体
全基因组中基因组序列上常见的多态位点(SNP)
进行筛查和分析,构建出整合了人类遗传多态信
息的“单体型图”,将为疾病易感性、药物敏感
性和人类进化研究提供最基本的信息与分析工具。
HGP让我们有了认识人类的参考图.
HapMap 是我们区别彼此差异的参考图;
SNP数量剧增, 150-300-600-1000万;
SNP- CNV
如何筛查和检索SNP?
SNP的筛查:
人群的基因组测序 24-50-100人
SNP检索与选择:
数据库检索;
根据目标选择
拥有自己的基因组图谱

随着高通量SNP检测技术和DNA测序技术的发
展,拥有个人基因组图谱不是梦!
1 全基因组测序全基因组
30亿-1万-1000 USD
2 SNP芯片
Affymetrix; Illumina
1000 USD
如何解读是今后长时期问题
SNPs related databases
http://egp.gs.washington.edu/ (NIEHS SNPs Program)
2. http://snp500cancer.nci.nih.gov/home_1.cfm?CFID=264728&CF
TOKEN=86045010 (SNP500Cancer)
3. http://www.hapmap.org/(HapMap project)
4. http://www.ncbi.nlm.nih.gov/SNP (National Center for
Biotechnology Information)
5. http://snp.ims.u-tokyo.ac.jp/index.html (SNPs database from
Japan)
6. http://www.ornl.gov/sci/techresources/Human_Genome/faq/snps
.shtml
……
1.
基因组多态性
数据库(SNPs)
人类单倍型图谱计划(HapMap)
• reference samples: 4 world populations
Nigeria
30 sets of trios(30 both-parent-and-adultchild trios )
Japan
China
U.S.
45 unrelated individuals
45 unrelated individuals
30 sets of trios
• SNPs: computational candidates
where both alleles were seen in
multiple chromosomes
• genotypes: high-accuracy assays from various
platforms; fast public data release
http://www.hapmap.org
SNP selection for Disease-gene Association Studies



Approximately 10 million common variants exist
in genome
Testing all for association is impractical today
Can the list be reduced with loss of power?



SNPs in Coding (Amino Acid Changes)
SNPs in other functional regions, i.e. regulatory
elements
tagSNPs
TagSNPs
Alleles
of SNPs that are close together tend to be inherited together.
A set of associated SNP alleles in a region of a chromosome is called a
"haplotype".
Most chromosome regions have only a few common haplotypes (each with a
frequency of at least 5%), which account for most of the variation from person
to person in a population.
A chromosome region may contain many SNPs, but only a few "tag" SNPs can
provide most of the information on the pattern of genetic variation in the region.
Haplotype 1
Haplotype 2
Haplotype 3
.
The two SNPs in color are sufficient to identify (tag) each of the three haplotyes.
For example, if a chromosome has alleles A and T at these two tag SNPs,
then it has the first haplotype.
SNPs检测方法
1.理想的检测SNPs的方法
——发现未知的SNPs,或检测已知的SNPs
(1) 灵敏度和准确度的要求
(2) 快速、简便、高通量、自动化
(3) 费用低廉
动脑筋的技术活,有意思,有趣,形式万变;
掌握基本原理,本质不离其中
SNP和突变部分筛选和检测方法
• Denaturing High Performance Liquid Chromatography (DHPLC)
• Single-Strand Conformation Polymorphism (SSCP)
• Restriction Endonuclease Fingerprinting (REF)
• Dideoxy Fingerprinting (DDF)
• Cleavase Fragment Length Polymorphism (CFLP™)
• Denaturing Gradient Gel Electrophoresis (DGGE)
• Heteroduplex Gel Electrophoresis (HTX)
• Chemical Cleavage of Mismatches (CCM)
• Enzymatic Cleavage of Mismatches (ECM)
• RNase Cleavage Assay (NIRCA™)
• Direct Sequencing
• Chip Technology
• Real-time PCR
• Mass Spectrometer
SNPs检测方法:原理区分





基于杂交方法:ASO, 基因芯片,LNA,
HRM, 液相芯片
结构,构象:PCR-SSCP, DGGE, CFLP
DHPLC, DASH,HRM
基于酶法: DNA聚合酶,连接酶, RNaseH,
测 序: 化学识别,酶法
FRET: Taqman,分子信标,循环探针
SNPs检测方法:检测区分






凝胶电泳分析技术
HPLC分析技术
质谱检测技术
荧光检测技术:流式,板式
固相芯片检测技术
试纸条显色
基因分型原理和方法关系简图
Hybridisation
Primer
Extension
Taqman
Oligonucleotide
Ligation
SNPlex
Nuclease
Cleavage
RFLP
Affimetrix
Amplifluor
Sequencing
minisequencing
Gel
separation
Illumina
DNA Array
DHPLC
Massy Assay
Mass
spectrometry
Plate
reader
Throughout Comparation
Illumina
Affymetrix
550/500 kSNP
Illumina
1536-plex
SNPlex
SNPstream
TaqMan/
Mass Array
基于杂交的方法

原理:
短的核苷酸探针在和互补的目的片段进
行杂交时,完全匹配和有错配两种情况
下,根据杂交复合体稳定性的不同而将
SNPs 位点检测出来。
差异越大,检测的特异性就越好
寡核苷酸探针特异杂交(ASO)
*
设计中包含SNP位置的特异的寡核苷酸顺序,
通过严格控制杂交和洗脱条件, 同时设置对照,
进行杂交时将SNP通过ASO杂交区分出来.
*
缺点: 杂交条件的严谨; 严格的对照
导致: 假阳性,阴性
*
提高△Tm

等位基因特异核苷酸探针 (Allele-specific
oligonucleotide,ASO) 。
修饰过的探针:引入一个错配的碱基、
PNA、 LNAs 等设计中包含SNP位置的特
异的寡核苷酸顺序.
通常20bp中一个碱基的差异会导致Tm值
下降5~7.5度,修饰后的Tm值会相差2倍.
Tm=2(A+T)+4(G+C) (15-20个bp)
肽核酸(Peptide nucleic acids,PNA)
PNA是一种核酸类似物,与核酸最主要的区别为其骨架是肽
键,而不是核酸的磷酸二酯键骨架,在肽键骨架上连有相应
碱基,从而具有以下特征:
1、热稳定性 一个PNA碱基杂交体的Tm值的贡献平均高1摄氏
度,受盐浓度影响很小。
2、与靶分子高特异性地结合 因为其杂合体Tm值高,受盐浓
度很小,因此在低盐浓度的体系中会极大的降低非特异的结
合。另外因为一个PNA碱基的错配平均会使其Tm值降低15度,
非特异结合很好排除。
3、链挤入 PNA能和挤入含有互补配对碱基区的双链DNA形成
三链复合结构,这一特性为其在表达调控以及反义治疗方面
提供了较大的应用空间。
4、对核酸酶和蛋白酶均不敏感 这对于在体外应用来说有较
大的价值。
与靶分子高特异性地结合



Tm值高
受盐浓度影响小(低盐浓度的体系)
△Tm更大(一个PNA碱基的错配会使其Tm
值降低8-20度)
PNA/DNA的非特异结合能很好排除。
LNA(locked nucleic acids)
其结构是在RNA分子的2′羟
基和核糖环的4′碳原子间连
入一个亚甲基的“桥”。
 特点:
1.能以很高的亲和性和互补的
DNA、RNA 或LNA 结合
(构象更利于杂交的稳定)
2.匹配和不匹配的△Tm增加

LNAs是一种合成的核酸类似物,其结构
是在RNA分子的2′羟基和核糖环的4′碳
原子间连入一个亚甲基的“桥”,由于
“桥”的作用使核糖环处于更利于杂交
的稳定构象,所以能以很高的亲和性和互
补的DNA、RNA 或LNA 结合,而这种高的
亲和性甚至在有一个错配碱基都会大大
降低,因此用此作为探针来检测单核苷酸
多态性。
双链DNA检测


高分辨率融解曲线(HRM)
动态等位基因特异杂交 (dynamic allelespecific hybridization,DASH)
HRM进行SNP检测原理
高分辨率融解曲线(HRM) 是一种分析DNA融解曲线的新方法.
DNA with
heterocygote
SNP
PCR
C
G
+
Intercalating
fluorescent
dye
T
A
C
G
C
T
A
G
C
C
T
A
A
A
T
T
G
G
C
G
Denaturation
reannealing
+
T
A
+ ...
Increasing
temperature
.
甲基化分析 MGMT
动态等位基因特异性杂交
(DASH)
将PCR产物的一条单链固定, 用
寡核苷酸探针杂交, 伴随温度升
高,同时检测DNA双链荧光变化,
从而检测基因多态或变异.灵敏
度和自动化程度高.
缺点: DNA 的PCR扩增产物长度
要求; 复杂的仪器设备.
SNP的检出率. 一般对已知SNP
的筛选.
液相芯片 (LiquiChip)
利用R-Phycoerythrine和Alexa FluorR 532
Detection等荧光检测试剂对这些相互作用进行定量
分析
双色球基编码
 利用两种不同的荧光染
料染色,每种荧光分成
10个色阶,这样,一个
100个球基的阵列,每个
球基可以有唯一的颜色
签名
“液态矩阵” 技术
利用不同的球基编码
(颜色)在同一孔中识
别多重反应使用带有不
同色彩编号的beads,
标记上不同的探针分子,
加入同一个样品检测体
系中,检测不同的被检
测分子。
基于流式细胞仪的分析


球基被水力聚焦成
一条直线通过检测
通道
两种激光激发荧光
检测原理
 红色激光识别球基
编号
 绿色激光识别报告
信号
杂交+荧光能量共振
Taqman 探针
分子信标(双分子间杂交)
蝎状探针(分子内杂交)
Taqman 法
分子信标(Molecular beacons)
添加LNA,提高特异性
蝎状探针 (Scorpion primer)
基于构象的SNP检测
*
PCR-SSCP
PCR-单链构象多态性分析(PCR-single
strand conformation analysis,PCR-SSCP)
*
*
特点: 小于200bp, 70%-95%的突变检测率。
对于长片段一般采用酶切后提高分辨率.
缺点: 技术要求高, 检出率低, 初筛.
SSCP
原
理
示
意
图
变性梯度凝胶电泳(DGGE):
*
*
DGGE技术: 在PCR基础上, 通过突变型和
野生型DNA在变性胶中的电泳速度的差别
检测差异碱基,灵敏度较PCR-SSCP高.
PCR的单碱基检出率在DNA片段长度600bp
以内可以达到95%.
缺点:能确定突变的位置 ;对引物、仪
器设备要求较高;
DGGE结果示意图: 1.纯合子a;
2.杂合子;
3.纯合子b
变性梯度与
解链状态的关系
异源双链分析
*
*
异源双链分析(heteroduplex analysis,
HA)分析:利用野生型和突变型DNA片段变
性成为单链, 在复性后可以形成异源杂合
双链, 经聚丙烯酰胺凝胶电泳就可以将正
常与基因突变形成的异源双链与正常双链
区分出来, 分辨率一般小于300bp。
缺点: 不能知道SNP位置和状态.
化学错配碱基裂解法
*
*
*
化 学 错 配 碱 基 裂 解 法 (chemical
mismatch cleavage,CMC) 是 利 用 变 异 顺
序的单链DNA与正常顺序单链DNA可形成
异源双链DNA,但是变异部分碱基是错配
的,错配碱基经修饰后可以被杂氮环己烷
等化学物质裂解,通过电泳观察DNA片段
长度即可知道突变存在的情况.
可以检测95%-100%的错配, 检测长度
可达到1-2 kb, 可知变异发生在何处。
缺点:非特异性.
化
学
错
配
碱
基
裂
解
法
示
意
图
裂解酶切片段长度多态性


裂解酶切片段长度多态性 (cleavase
fragment length polymorphism, CFLP) 可
以在长度为1kb以上的范围内,检测基因突变,
准确知道突变位置。其原理是: 利用切割酶
能够识别切割折叠结构连接处的特点
假阴性: 复杂的标记, 缺乏直观的检测.
Denaturing High Performance Liquid
Chromatography (DHPLC)
bp
587
458
434
298
257+267
174
102
80
Mutation Detection by dHPLC
dHPLC
Primer Extension (Single Base Extension)
T-allele + ddATP (dTTP, dCTP, dGTP)
5’-TTGCATTGTTTCTAGGAGAACCTGCGTCATACCTTTATCTATAGCCTTCCCCTAGGTCTT-3’
ACGCAGTATGGAAATAGATAT-5’
21mer extended product
C-allele + ddATP (dTTP, dCTP, dGTP)
5’-TTGCATTGTTTCTAGGAGAACCCGCGTCATACCTTTATCTATAGCCTTCCCCTAGGTCTT-3’
ATCCTCTTGGGCGCAGTATGGAAATAGATAT-5’
31mer extended product
dHPLC: Sensitivity of Mutation Detection
9
8
7
50 % mutant allele
Intensity [mV]
6
30 % mutant allele
5
20 % mutant allele
4
10 % mutant allele
3
5 % mutant allele
2
1 % mutant allele
1
DYS271 A allele
0
0
1
2
3
4
Retention Time [min]
5
6
基于酶的方法
1)限制性内切酶
2) DNA聚合酶
3)连接酶
4)RNaseH
……
限制性内切酶-RFLP
*
*
根据SNP变异导致限制性酶切长度改变,
早期需要结合Southern blot 技术进行检
测, 非常复杂, 对DNA量要求大. PCR技术
引入后, 诞生了PCR-RFLP 技术, 技术得
到简化.
关键缺陷: SNP导致RFLP的概率低,所以
大量的SNP不能采取这种方法检测.
产生多态性的原因是内切酶位点的变化。
原位点的消失;新位点的产生。
如 EcoR1 :
NNNGAATTCNNN
NNNCTTAAGNNN
I
II
NNNGATTTCNNN
NNNCTAAAGNNN
1
1
2
2
7kb
5kb
3kb
2kb
PCR-PIRA
(PCR-primer introduced
restriction analysis)
*
*
*
无中生有 SNP没有引起酶
切位点的改变, 但可以根据
基因单核苷酸多态顺序,在
PCR引物设计中,通过核苷酸
的改变引入特定的酶切位点,
从而进行PCR扩增,然后进行
限制性内切酶酶切分析.
可行性: 四核苷酸对称
缺点: 稀有酶昂贵价格;
酶切不完全.
DNA聚合酶





等位基因特异性PCR
多重等位基因特异性PCR
Taqman探针
引物延伸 /微测序法
焦磷酸测序反应
等位基因特异PCR
*
*
AS-PCR技术利用包含SNP位点的PCR引
物进行特异性扩增, 假定含有SNP之A的
引物可以扩增, 而含有SNP之G的引物不
能扩增. 可以人为修饰引物提高特异性.
缺点:对引物设计、酶的精确性要求高;
需要严格对照. 容易导致非特异性扩增
等位基因特异性PCR
Allelic Specific PCR in Multiplex of
Five Y Chromosome loci
M 1
2
3
4
5
6
7
8
M89 ( 365bp )
M110 ( 250bp )
M50 ( 219bp)
M7 ( 174bp )
M119 ( 144bp )
微测序法/引物延伸法
近年来发展迅速,基于引物单碱基延伸产生了一些
列检测方法,包括SNaPshot,SNPstream,APEX基因
芯片,Mass Array,多重DHPLC等,这是依赖DNA 聚
合酶来分辨碱基多态性位点的一类方法,其特异性比建
立在等位特异性杂交的方法要高。称为Minisequencing
/Primer extension。
检测引物的3′末端碱基紧挨于多态性碱基,在DNA 聚合
酶及 标记ddNTP 的存在下进行一个碱基的延伸反应,
延伸的这个碱基就是多态性碱基。
基本步骤(液相)
1.设计PCR扩增含SNPs位点的一段DNA
2.对PCR产物进行纯化(去除引物和dNTP)
3. 引物延伸
4.延伸产物检测( 放射性同位素标记法、
发光检测法、凝胶为基础的荧光检测法、
质谱分析法、变性高压液相色谱法等)
相关检测技术

Mass Array

SNaPshot

SNPstream

Pyrosequencing
Sequenom MassARRAY


基于引物延伸反应和MALDI-TOF质谱技术,可
快速进行基因型分析. 设计多达40重的基因型
检测。设计软件为多重反应自动设计PCR和延
伸引物。
MassEXTEND反应 : 所有SNP均使用同一终止
反应配方和通用的反应条件,延伸的产物具有
位点特异的分子量,分析软件能根据此分子量
的差异决定其基因型。





5-Step Process:
1) PCR amplification (20-48重)
2) SAP treatment (残余引物和dNTP)
3) Extension
4) Ion Exchange Clean-up
5) MALDI-TOF m/z Measurement
Multiplex SNaPshot Kit
----基于5色荧光的多重SNP检测试剂盒



十重SNP检测(10-20)
成本降低6-8倍,0.3US$/基因型
可多重PCR,延伸反应及纯化合并
单碱基延伸反应原理
PCR Amplicon
Primer
5’
3’
SNP of interest
CCATGACTGATTCC
NNNNNNAGCCTGGTACTGACTAAGGCNNNNNNN
Ready Reaction mix:
AmpliTaq FS
ddTTP + ddCTP + ddATP + ddGTP
Extend and
Terminate Primer
dd
G
CCATGACTGATTCC
NNNNNNAGCCTGGTACTGACTAAGGCNNNNNNN
Detection of fluorescently labeled
fragments by capillary electrophoresis
Single-plex SNaPshot™ Workflow
缺点:成本高,操作步骤多,无法多重PCR
1. Target Amplification
2. Purify PCR products/
Eliminate primers and dNTPs
G
3. SNaPshot™ Reaction
C
4. [F]ddNTP cleanup
5. Electrophoresis / Analysis
GG AG AA
SNaPshot™ Multiplex System
Primers designed with
tails of differing lengths
T
T
C
A
C
ddGTP
ddCTP
ddTTP
ddATP
A
T
A
T
G
C
A
G
Primer
Template
G
Extend and
Terminate Primer
T
A
G
C
T
A
C
G
Electrophoresis
C
G
Color = genotype
Size = locus
APEX (arrayed primer extension
GenomeLab SNPstream
将多重PCR与荧光标记的单碱基引物延伸技
术相结合, 同时引入液相芯片杂交技术。
在特制384孔板的每个微孔中可分析12个或
48个SNP位点。
高保真/高精确性——液相单碱基引物延 伸
技术准确率超过99%。
通用芯片使用广泛
焦磷酸测序法(Pyrosequencing )



DNA 聚合酶、ATP 硫酸化酶(ATP sulfurylase) 、
荧光素酶(luciferase) 和三磷酸腺苷双磷酸
酶( apyrase) 。
原理:DNA 聚合酶在一种dNTP的存在下进行
引物延伸反应,而引物的成功延伸将伴随焦
磷酸的释放,焦磷酸在荧光素酶的存在下能
引一种发化学发光反应,通过发光计的实时
监测来达到检测的目的。
该思路带来了新的测序革命!
C/C
A/C
A/A
Illumina system
Illumina’s SNP Bead Design
Address
23 b
Probe
50 b
50-base gene-specific probe linked to Address
23-base address code
Bead Decoding
Example: 16 Bead Types
Decoder Oligo
Decode hyb 1
Decode hyb 2
1
2
3
4
5
Decoder hybridization 1
6
7
8
9
10 11 12 13 14 15 16
Decoder hybridization 2
Decoding by Sequential Hybridization


Scales exponentially (colors)steps = codes

(4 colors)2 steps = 16 codes

(4 colors)6 steps = 4096 codes
Quality control of every bead on every
array


Location and intensity check
Small percentage of failures screened out
informatically
连接酶




Ligase chain reaction (LCR)
Ligase detection reaction
连接酶检测反应(LDR)
联合链式反应 (combined chain reaction ,
CCR)
连接-滚环扩增反应 (ligation-rolling
circle amplication , LRCA)
LDR-测序胶电泳SNP分型图
杂交结果红色为标准分子量,蓝色为LDR产物
SNPlex技术原理: OLA/PCR Assay
GER
Universal PCR
Priming site
LSO
P
ZipCode1
g DNA
Target
1. OLA
ZipCode2
A ASOX
G ASOY
GER
C
P
A
G
C
Ligation Product
Formed
(Homozygote shown in this case)
2. Clean-up
(removes unligated
probes)
高通量SNPlex技术: 准确,可灵活调整通量与检测SNP位点
Cycleave PCR法原理


Cycleave PCR法是由RNA和DNA构成的杂合Cycling 探
针与RNase H组合使用的高灵敏度检测方法,能够高效
率地检出目的基因。
Cycling 探针内部夹有RNA部分,5′端标记荧光物质,
3′端标记淬灭物质,当探针处于完整状态时,由于荧光
淬灭作用抑制荧光物质发出荧光,但当探针与扩增产物
中的互补序列杂交后,RNase H在RNA部分将探针切断,
淬灭抑制作用解除,荧光物质发出荧光,通过测定荧光
强度,能够实时监测扩增产物量。如果探针的RNA部
分或与RNA部分相邻的2 ~ 3个碱基与模板不互补,
RNase H 就不能在RNA部分将探针切断,所以该检出
方法是一种即使一碱基不同也能识别的高特异性检出方
法,特别适合于SNP解析。
单一SNP检测与多重SNP检测; 特异芯片与通用芯片检测
基因SNP的ELSI问题
基因检测和个人基因组的担心?






基因组顺序是个人的隐私, 基因检测如何保
护个人的基因隐私?
基因组SNP与疾病的相关性是否会导致: 上
学, 个人培养, 就业, 婚姻, 保险等方面的问题.
基因犯罪和基因讹诈, 基因歧视
基因组SNP研究是否会导致种族歧视和个人
基因组歧视?如何立法保护?
基因SNP研究是否会影响社会安全, 法律
医学遗传检查的限制和结果的管理.
Molecular Epidemiology?
gene discovery &
Characterization
SNPs
Haplotypes
Genes
Environment
Medical Practice
etiology
diagnosis
treatment
prevention
吸烟致肺癌的分子流行病学研究
DNA 损伤修复-NER通路与肺癌遗传易感性
癌的形成过程及其影响因素
活化
解毒
损伤
修复
增生
Exposure
前致
癌物
凋亡
Cancer
终致
癌物
DNA
损伤
基因
突变
遗传因素
癌前
病变
恶性
肿瘤
(一)研究对象
病例收集
 肺癌病例:1000例以上,经过各个医院病理科病
理确诊,来自于南京、武汉和上海;
 目前已收集了1450例病例
对照收集
 1000例以上, 对照选自各个医院无肿瘤患者和社
区健康人群,要求年龄、性别与病例频数匹配;
 目前共收集对照1400例。
(二)流行病学调查
主要内容包括一般情况、职业暴露史、吸烟史、
饮食行为习惯、个人疾病史、家族史等。
研究环境因素以及环境和遗传因素相互作用对
肺癌的影响.
(三)血标本(充分利用资源)
所有研究对象均采集静脉血5ml(EDTA抗凝),
分离血桨、白细胞和红细胞,低温冷冻保存。所
有标本完成DNA提取工作。
(四)基因和SNP选择
根据研究目标,兴趣和经费进行选择; 根据
要求和文献选择SNP,包括功能位点和标签SNP.
本项目围绕DNA损伤修复基因通路中NER通路
选择8个核心基因(ERCC1,ERCC2, ERCC3,
ERCC4, ERCC5, XPA, XPC 和DDB2),挑选54个
SNP(r2=0.7)
(五) 根据情况,选择合适的基因分型方法
本项研究所有病例和对照标本采用
Taqman 方法进行 SNP检测,10% 样本进
行重复验证.分型有效率需要>95%.
精打细算; 量力而行!
(六)数据分析
筛选与肺癌相关的SNP位点(P<0.05),
进行单倍型分析,分层分析,基因互作分
析,基因与环境互作分析等.
结果: 研究表明, ERCC1, ERCC2/3,
ERCC4,XPC等基因SNP与肺癌相关,存在基
因互作,基因环境互作,且呈现SNP剂量依
赖效应.
下一步:
验证
1 连锁功能位点的分析, 扩大样本验证;
2 其他中国人群体的独立验证;
3 其他种族人群的独立验证;
4 前瞻性结果验证
二. 机制
连锁位点分析,
功能研究, 阐明机制;
一.
阳性多态位点功能研究策略
1 编码区氨基酸改变, 蛋白功能,酶活性改变
2 编码区沉默突变, 密码子偏爱改变,蛋白合成差异
3 启动子,UTR区域,内含子突变导致 mRNA转录,
稳定性改变
* 启动子引起CpG改变,表观修饰
* 启动子与转录因子结合能力改变
* UTR改变与增强子等反式因子作用
* UTR改变与microRNA作用
4 内含子剪切改变,产生新的mRNA
线粒体乙醛脱氢酶基因变异
对硝酸甘油代谢及疗效的影响
随着人们生活水平的提高,冠心病
逐渐成为威胁人类健康主要杀手之一,由于
冠心病本身发病急重的特点,针对冠心病治
疗的研究日益成为科学研究的热点。硝酸甘
油是一种已经应用百余年的扩血管的药物,
具有重要的临床应用的价值,硝酸甘油作为
抗心绞痛的首选药物。 舌下含服硝酸甘油是
治疗心绞痛的的常规治疗方法.
线粒体乙醛脱氢酶(ALDH2)是属于
人体内辅酶Ⅰ依赖酶超基因家族中的一员,对
人体内乙醛的氧化起到主要的作用 ,在线粒
体乙醛脱氢酶(ALDH2)第12个外显子存在一
个 G/A(SNP),相对应在其编码的蛋白对其
天然底物-乙醛的酶活性的严重下降(缺陷型
酶活性为正常酶活性的6 %)
酒精在体内的代谢遗传学
Alcohol dehydrogenase (乙醇脱氢酶 ADH)
ADH2 – 高活性等位基因频率
5-20% 高加索人
85% 亚洲人
Aldehyde dehydrogenase (乙醛脱氢酶,ALDH)
ALDH2 – 突变没有活性的等位基因频率
50% 亚洲人
高加索人中很少
ALDH2
CH3-COH
CH3-CO
CH3-COOADH
CO2
刺激肾上腺、去甲肾上腺素分泌
,从而引起面红耳赤、心律加快
、皮温升高等线粒体毒性症状




心绞痛硝酸甘油治疗人群的关联研究后
进行了深入的功能研究:
不同基因型的ALDH2的真核表达,纯化,酶
活性检测;
不同基因型的ALDH2的硝酸甘油药物代
谢研究
不同ALDH2基因型的志愿者口服硝酸甘
油的药物代谢研究 (HPLC检测)
饮酒脸红
ALDH2基因缺陷
硝酸甘油治疗
心绞痛效果差
设想1: 高通量单位点SNP检测





基本原理: 引物延伸法(又称小测序法)
针对特定待检测的SNP设计一段约40bp
的引物A, 引物3’恰巧在SNP位点前一位.
将引物A固定在芯片上, 每个芯片点样密
度根据条件和要求(一般可达到1000-10000).
对所测样本DNA进行包含SNP位点的PCR扩
增;
芯片每一个位点加入PCR产物, 以及四色荧
光标记双脱氧核苷酸(*ddNTP), 进行引物延伸



洗脱PCR产物以及游离荧光标记分子
检测每个位点的荧光波长及其强度,
即可知道每一个样本的SNP状态 (纯合,杂
合)
** 由于A-T, G-C互补, 因而可以将四种
荧光变为双色荧光, 每个位点设计2条引
物, 这样检测更加方便, 一般的双色荧光
检测仪即可应用, 而且跳过了四色荧光检
测的专利技术.





策略2.
对所测样本DNA进行包含SNP位点的
PCR扩增.
将引物A分别加入到每一个扩增产物中,
同时, 加入四种带有荧光标记的双脱氧三
磷酸核苷酸(*ddNTP)引物延伸.
纯化去除游离的荧光标记分子, 将混
合物固定在玻片上.
检测每个位点的荧光波长及其强度.
设想2





多位点SNP检测
也采用引物延伸法
针对特定待检测的SNP设计一段40bp
的引物, 引物3’恰巧在SNP位点前一位.
按条件和需要设计多对检测SNP的引物
(如1000对).
将这些引物按一定次序固定在玻片上.
将 待 测 样 本 DNA ( 约 1ml 血 , 0.1-1x
106-7 DNA), 经 高 温 和 超 声 打 断 成 为
<200bp的碎片.




将DNA片段加入到玻片杂交反应缓冲
体系中, 进行较高温度(根据引物长度设
定, 如72OC度) 封闭式充分杂交
洗脱去除未杂交DNA;
加入两种荧光标记的双脱氧三磷酸核
苷酸(如*ddATP, *ddGTP, 另外两种可以
通过互补方法省略, 也可以采用四色荧
光).
耐热DNA聚合酶(Taq酶), 反应缓冲液,
引物延伸和高温变性.





在95 C 条件下严格和多次洗脱基因组
DNA以及游离的荧光分子.
检测每个位点的荧光强度和波长
条件需要多次优化.
72OC-95OC 可以重复进行, 用于提高
荧光强度,相当于线性扩增. 重复次数的
设定可以根据DNA样本的量以及荧光强
度和检测灵敏度决定, 如果荧光强度足够
尽量避免重复.



荧光分子如果强度不足, 还可以采用:
(1).采用纳米微球技术, 将100-1000个荧
光分子包裹成纳米微球, 再与双脱氧三磷
酸核苷酸结合, 目前, 我校已经有人研究.
(2). 采用双脱氧分子接生物素, 采用
Avdin-biotin高度结合的特性, 以及用抗原
-抗体放大, 采用纳米微球技术, 荧光检测,
提高灵敏度.
可行性分析:


特异性
引物长度的设定合杂交温度,杂交液
成份等条件需要实验优化, 目前引物选择
40bp, 理论上40bp核苷酸已经足以代表
基因组中任意一个单独的顺序, 在720C高
温下杂交, 经过严格洗脱, 40bp的引物已
经能够保证引物和模板DNA的独特的结
合, 在此基础上进行引物延伸具有独特的
SNP准确性.
另外, 由于非特异性结合是随机的, 通
过两种荧光的等量扣除. 这需要实验进一
步探索和证实.
灵敏度:


目前FISH检测单拷贝的基因, 长度5kb即可
在荧光显微镜下检测到荧光信号, 这种长度
的DNA探针约标记1250个(初级)信号分子(荧
光等), 1ml 血DNA含有1X 106-7DNA, DNA引
物固定在玻片上> 108-9, 引物与超声碎片
DNA碰撞配对的概率可以计算> 104-5, 因而
理论上可以检测外周血DNA多位点的SNP.
而且, 通过95-72OC反复进行, 可以提高灵敏
度.

Southern blot 检测基因组单拷贝DNA对
DNA的量的要求是107分子数量级, 可以
通过同位素, 生物素,荧光素的方法进行
特异和灵敏检测, 理论上通过芯片进行逆
向杂交,将检测位点显微化, 应该理论上
是可行的.
Download