基于基因集富集分析的畜禽复杂性状GWAS分析平台及其应用

advertisement
基于基因集富集分析的畜禽复杂性状
GWAS分析平台及其应用
潘玉春 王起山
panyc@sjtu.edu.cn
2011.8.12
一、背景
1
GWAS
全基因组关联分析方法(GWAS)是近几年提出的复杂性
状功能基因鉴定的新策略。该方法是基于全基因组范围内
的序列变异,筛选出那些与性状关联的SNPs。
问题
—需要对数以万计的SNP位点进行检测,可能出现许多假阳
性或假阴性的结果。
—缺乏对显著SNP的生物学解释(如所处的代谢通路、生物
过程等),导致很难解释性状的分子遗传机制。
2
 GSEA-GWAS
 基因集富集分析的基本思想是使用预定义的基因集(通
常来自功能注释或先前实验的结果),筛选出与性状显
著相关的通路等注释集合。
 引入基因集富集分析的方法比单基因分析能获得更多、
更有生物学意义的基因信息,将有助于解决上述两个问
题。
Mootha 等(2003)提出用于表达芯片的数据分析
Wang Kai 等(2007)扩展到GSEA-GWAS
3
GWAS using single marker
based association test
4
GSEA-GWAS 分析流程
基因集定义
选择GWAS结果显著的
SNP 集合进行Fisher 检验
基因集映射基因
选择GWAS结果中所有
SNP进行富集分析
基因映射SNP
显著的基因集
GWAS分析结果
基因集QTL映射
功能验证
5
GSEA-GWAS 研究进展
 目前基于基因集富集分析的全基因组关联分析方法(
GSEA-GWAS)已经应用于人类(随机无关人群或核心家
系)和小鼠(高度近交)的资源群体。
http://www.nr.no/pages/gseasnp
(Bioinformatics 2008)
https://webtools.imbs.uni-luebeck.de/snptogo
(Bioinformatics 2008)
6
二、畜禽GSEA-GWAS平台
 牛基因组SNP功能注释与Fisher富集分析平台
http://klab.sjtu.edu.cn/SNPknow
http://klab.sjtu.edu.cn/SNPpath
 猪、牛、鸡基因集富集分析平台
http://klab.sjtu.edu.cn/GWAS
7
牛SNP功能注释及Fisher富集分析平台
– KEGG Pathway:
转录调控、信号转导
、代谢
– Gene Ontology:
cellular component,
biological process,
molecular function
支持基因集
8
分析流程
SNPpath
Web Server
Cluster for
Computering
MySQL Database
Gene Ontology
Homepage of SNPpath
Path details
Result Page
9
Gene Ontology associated with traits
分析原理
Fisher’s精确概率法利用超几何分布的原理推断每个基因集
中的差异表达基因的比例是否与整个基因芯片上差异表达基
因的比例相同。
基因集注释的SNP
差异表达 非差异表达
SNP
SNP
a
b
合计
a+b
非基因集注释的SNP
c
d
c+d
合计
a+c
b+d
a+b+c+d
10
分析实例
Snelling et al. 2010 Journal of
Animal Science
2013 animals
BovineSNP50 BeadChip (50K)
assay
birth weight (BWT),
BW gain from birth to weaning,
adjusted to 205 days (WG),
205-day adjusted weaning weight
(WW), 160-day adjusted
postweaning BW gain (PWG)
365-day adjusted yearling weight
(YW).
11 11
Growth traits
Pathway ID
Pathway name
P value
00330
Arginine and proline metabolism
0.0405
00480
Glutathione metabolism
0.0213
00030
Pentose phosphate pathway
0.0184
00512
O-Glycan biosynthesis
0.0637
04620
Toll-like receptor signaling pathway
0.0762
00330
Arginine and proline metabolism
0.0405
00480
Glutathione metabolism
0.0213
00330
Arginine and proline metabolism
0.0405
00480
Glutathione metabolism
0.0213
00030
Pentose phosphate pathway
0.0184
00330
Arginine and proline metabolism
0.0405
00480
Glutathione metabolism
0.0213
birth weight(BWT)
205-day preweaning gain (WG)
160-day postweaning gain (PWG)
205-day weaning weight (WW)
365-day yearling weight (YW)
12
13
发表论文
14
猪、牛、鸡基因集富集分析平台
– KEGG Pathway:
转录调控、信号转导、代谢
– Gene Ontology:
cellular component, biological
process, molecular function
– the Pfam protein families
database (Pfam)
– protein domains, families and
functional sites (PROSITE)
支持基因集
15
支持物种
猪、 牛、 鸡
分析方法
 Single column P-values, the data can be analyzed
using Irizarry‘s method ;
 Two columns of P-values, the data can be analyzed
using either the F test or t test;
 The program also accepts up to 5000 columns of P-
values which can be analyzed using either the Efron‘s
re-standardized .
16
程序主页
17
注释集合
18
富集分析流程
19
分析实例
Snelling et al. 2010. J. Anim. Sci. 88(3):837–848.
To illustrate the application of GWASknow, we analyzed the SNP data from the
GWAS of growth in crossbred beef cattle which used BovineSNP50 BeadChip
(50K) assay. Body weights (BW) gain from birth to weaning were utilized.
20
The analysis results by the restandardized method are shown. A total of 28
KEGG pathway gene sets having FDR-corrected p-values< 0.01 were tabulated.
21
QTL映射
http://animalgenome.org/cgi-bin/QTLdb/BT/summary
Many of the gene sets we identified made good biological senses. For example, The
KEGG terms 'Selenoamino acid metabolism' and 'O-Glycan biosynthesis' overlap QTL
22
described for average daily gain, body weight, feed conversion ratio.
相关论文
23
农业与生物学院动物科学系
上海市兽医生物技术重点实验室
Thanks!
24
Download