高通量测序技术在生命科学研究中的应用 岳 桂 东 2013年4月 内容提要 二代测序技术简介 454 测序 Solexa测序 SOLiD测序 DNA测序文章介绍 全基因组测序 基因组重测序 简化基因组测序 RNA测序文章解析 转录组测序 表达谱测序 小RNA测序 DNA测序技术的发展 Heliscope PCR (1983) DNA双螺旋 (1953) Single molecule real time(SMRT) 3700 (1998) Nanopore 荧光ddNTP 第一台商用全 自动测序仪 (1987) 遗传密码 (1966) 2010 1950 1960 1970 1980 1990 化学降解 和Sanger (1977) DNA是遗 传物质 (1952) DNA重组技术 (1974) 2000 Solid System (2007) 毛细管电泳 Sequencer (1996) 第一台自动 测序仪 (1986) Solexa (2006) 454 (2005) 第二代测序技术 454:SBP(sequence-by-pyroseuencing)焦磷酸测序 Solexa:SBS(sequence-by-synthesis)边合成测序 SOLiD:SBL(sequence-by-ligation)连接法测序 Illumina /Solexa/HiSeq测序简介 • GA与Solexa: GA最早由Solexa研发,Illumina收购Solexa。 • 升级: 型号:GAI -> GAII -> GAIIx -> HiSeq2000 产量: 1G -> 35G -> 85G -> 200G -> 600G GA HiSeq2000 Lane 1 Lane 2 A flow cell contains eight lanes . Flowcell 流动槽 . Lane 1 Lane 2 . . Lane 8 A flow cell contains eight lanes . . Lane 8 A flow cell contains eight lanes Each lane/channel contains three columns of tiles Lane 1 Lane 2 . . Each lane/channel contains three columns of tiles . Lane 8 Column 2 Column 1 Column 3 Column 2 Each lane/channel contains three columns of tiles Column 1 Each column contains 100 tiles Column 2 Each tile is imaged four Column times3 per cycle – one image per base. Each tile is imaged four times per Each column 100 tiles cycle –contains one images image per 345,600 for base. a 36-cycle run Tile 20K-30K Clusters Column 3 Each column contains 100 tiles Tile 20K-30K Tile Clusters 20K-30K Clusters Column 1 350 X 350 µm 350 X 350 µm 345,600 imagesfour for atimes 36-cycle Each tile is imaged per run cycle – one image per base. 345,600 images for a 36-cycle run 测序簇的生长 Prepare DNA fragments Ligate adapters Attach single molecules to surface Amplify to form clusters Sequence ~1000 molecules per ~ 1 µm cluster ~1000 clusters per 100 µm square ~40 million clusters per experiment 20 mnicros 3’ 5’ 边合成边测序 Cycle 1: Add sequencing reagents First base incorporated Remove unincorporated bases A T G C C G T Cycle 2-n: Add sequencing reagents and repeat T A C A Detect signal C G A T T A G A C T C C G A G C T C G A T 5’ • All four labelled nucleotides in one reaction • High accuracy • Base-by-base sequencing • No problems with homopolymer repeats 三种方法比较 平台 原理 454 数据量 时间 读长 错误种类 1 Gb 乳液PCR 焦磷酸测序 1day 700bp 插入缺失 Solexa 簇产生 可逆阻断 合成测序 600 Gb 8days 2*150bp 替换 Solid 乳液PCR 连接测序 200 Gb 7days 2*50bp 替换 高通量测序技术给基因组学研究 带来新的科研思路! 第一代测序 Sanger 以高通量为特征的新一代测序技 术从2005年开始相继出现,分别 为 454(2005) 、 Solexa(2006) 、 Solid(2007);三种二代测序技术 各具特色。 新一代测序 第二代测序 技术 技术 第三代测序 技术 1、De novo基因组测序 不需要任何 参考序列即 可对某个物 种进行测序。 对物种进行 测序,并用 生物信息学 方法进行拼 接、组装, 从而获得该 物种的基因 组序列图谱。 研究内容: 基因组组分分析:原始数据统计、覆盖度 计算、组装结果统计、GC含量分析; 基因注释及预测: 重复序列分析及注释、 基因结构预测及功能注释、Non-coding RNA注 释、转座子及串联重复序列注释; 比较基因组学及进化分析:特有基因区段 检测、特有基因检测、快速进化基因检测、共 线性分析、基因家族分析 数据库网站的建立 1998 2000 2001 2002 2004 2006 2007 2008 2009 2010 2011 2012 近年BGI参与发表动植物基因组文章 物种名 基因组 科 发表杂志 发表时间 黄瓜 熊猫 弓背蚁/印度跳蚁 切叶蚁 中国仓鼠 马铃薯 白菜 裸鼹鼠 食蟹猴/中国恒河猴 猪蛔虫 木豆 埃及血吸虫 谷子 番茄 牦牛 亚麻 盐芥 雷蒙德氏棉 牡蛎 梨 西瓜 家猪 蝙蝠 梅花 山羊 小菜蛾 鸽子 鹰嘴豆 树鼩 短花药野生稻 乌拉尔图小麦 粗山羊草 游隼、猎隼 350M 2.25G 300 Mb 300M 2.6G 844M 485M 2.6Gb 2.8G 273M 833M 385M 420M 900M 2.66G 400M 260M 775M 559M 527Mb 425 Mb 2.6G 2.1G 280Mb 2.66 Gb 343Mb 1.11Gb 738Mb 2.86Gb 342Mb 5G 5G 1G 葫芦科 熊科 蚁科 蚁科 仓鼠科 茄科 十字花科 仓鼠科 猴科 蛔科 豆科 蛭科 禾本科 茄科 牛科 亚麻科 十字花科 锦葵科 牡蛎科 蔷薇科 葫芦科 猪科 蝙蝠科 蔷薇科 牛科 菜蛾科 鸠鸽科 豆科 树鼩科 禾本科 禾本科 禾本科 隼科 Nat Genet Nature Science Genome Res Nat Biotechnol Nature Nat Genet Nature Nat Biotechnol Nature Nat Biotechnol Nat Genet Nat Biotechnol Nature Nat Genet Plant J PNAS Nat Genet Nature Genome Res Nat Genet Nature Science Nature Comm Nat Biotechnol Nat Genet Science Nat Biotechnol Nature Comm Nature Comm Nature Nature Nat Genet 2009.11 2010.01 2010.08 2011.06 2011.06 2011.07 2011.08 2011.10 2011.10 2011.10 2011.11 2012.01 2012.05 2012.05 2012.07 2012.07 2012.07 2012.08 2012.09 2012.11 2012.11 2012.11 2012.12 2012.12 2012.12 2013.01 2013.01 2013.01 2013.02 2013.03 2013.03 2013.03 2013.03 2. 全基因组重测序 个体基因组重测序 中国农大6 株玉米基因组重测序。 Nat Genet. 2010;42(11):1027-30. Genome-wide patterns of genetic variation among elite maize inbred lines. 首尔国立大学1株野生大豆基因组重测序。 Proc Natl Acad Sci U S A. 2010;107(51):22032-7 Whole-genome sequencing and intensive analysis of the undomesticated soybean (Glycine soja Sieb. and Zucc.) genome. 中科院植物所3 株高粱基因组重测序。 Genome Biol. 2011;12(11):R114. Genome-wide patterns of genetic variation in sweet and grain sorghum (Sorghum bicolor). 中国甜高粱, 美国甜高粱 , 中国籽实高粱;对比美国籽实高粱。 加拿大阿尔伯塔大学2头牛基因组重测序。 BMC Genomics. 2011;12:559. (黑安古斯牛+荷斯坦牛) Whole genome resequencing of black Angus and Holstein cattle for SNP and CNV discovery. 澳大利亚南十字星大学6株籼稻基因组重测序。 Plant Biotechnol J. 2012;10:623-34. (3株不育系+3株恢复系) Genome-wide DNA polymorphisms in elite indica rice inbreds discovered by whole-genome sequencing. 群体基因组学研究 BGI 参与29只家蚕和11只野蚕基因组重测序 Science, 2009, 326: 433-4. Complete resequencing of 40 genomes reveals domestication events and genes in silkworm (Bombyx). BGI 参与14株栽培大豆和17株野生大豆重测序 Nature genetics, 2010,42:1053-9. Resequencing of 31 wild and cultivated soybean genomes identifies patterns of genetic diversity and selection. BGI 参与40栽培稻和10野生稻基因组重测序 Nature Biotechnology, 2011,30:105-11. Resequencing 50 accessions of cultivated and wild rice yields markers for identifying agronomically important genes. 瑞典乌普萨拉大学37家猪和11野猪基因组重测序 Proc Natl Acad Sci USA. 2012,109:19529-36. Strong signatures of selection in the domestic pig genome. 全基因组甲基化测序 (Bisulfite处理+基因组重测序) WGBS Bisulfite处理和高通量测序相结合; C碱基的甲基化水平; 单碱基分辨率DNA甲基化图谱; 适合物种甲基化修饰模式的精细分析; 差异性甲基化区域(DMR)分析; DNA甲基化研究金标准。 样品量: 每样品所需数据量 (clean data) 每样品所需DNA量 ≤40 G bp 41-80 G bp ≥10 µg ≥20 µg 81-120 G bp ≥30 µg 数据量:推荐30x,至少基因组大小的20x 拟南芥Whole genome Bisulfite-seq文章 有参考基因组 Shotgun bisulphite sequencing of the Arabidopsis genome reveals DNA methylation patterning. Nature, 2008, 452, 215-219. 芝加哥大学 实验设计 研究目的 绘制全基因组甲基 化图谱 研究材料: 1个野生拟南芥和6个 甲基化转移酶突变拟 南芥(均为持续光照 下生长五周) 测序策略: Bisulfite-seq illumina genome analyzer 91 PE 第一篇Bisulfite-seq的文章; 第一次绘制拟南芥的甲基化图谱。 研究成果 1、野生型拟南芥经过数据过滤后得到2.6 billion clean data,覆盖度达到93%。其 中拟南芥基因组中约43 million C中的92% 的测序深度达到31*,全基因组平均深度20*。 这与常规Bisulfite-seq用于研究特定区域 DNA甲基化所得的结果一致; 2、全基因组范围内甲基化情况:24% CG, 6.7% CHG and 1.7% CHH;且三种类型的 甲基化水平分布不同:CG类型或者不发生 甲基化或者甲基化水平为80-100%;CHG 或者不发生甲基化或者甲基化水平为10%; CHH甲基化水平在20-100%之间均匀分布; 3、对于突变型,每种突变型得到90 million 数据;分别分析了甲基化转移酶对 全基因组甲基化状态的影响; 4、Bisulfite-seq比传统基于芯片的研究方 法灵敏度高;且能用于研究芯片所不能研究 的重复序列; 拟南芥胚胎Bisulfite-seq文章 Genome-wide demethylation of Arabidopsis endosperm. Science. 2009, 324: 1451. 加利福尼亚大学 实验设计 研究目的 绘制全基因 组甲基化图 研究拟南芥胚 谱 乳基因印记与 DNA去甲基化 之间的关系 研究材料: 授粉7-9d 后野生型拟 南芥胚乳组织、缺失 DME(DNA糖基化酶) 拟南芥胚乳组织 对照:授粉7-9d 后野 生型拟南芥胚胎组织、 四周龄野生型拟南芥 aerial 组织 测序策略: WGBS、 Illumina GA 研究成果 1、与胚胎相比,胚乳中 CG、CHG、CHH 甲基化水 平均降低。 2、 DME活性对通过RNA 干扰调控的非CG甲基化 有上调作用。 3、胚乳中母源基因组CG 的去甲基化现象同时伴随 着胚胎中CHH的高甲基化 4、与胚胎相比,胚乳 CHG、CHH高甲基化区域 基本富集在siRNA靶序列 区域。 家蚕全基因组甲基化图谱 Single base-resolution methylome of the silkworm reveals a sparse epigenomic map. Nat Biotechnol, 2010, 28(5):516-20. 中科院昆明动物所 华大基因 实验设计 研究目的 绘制全基因 组甲基化图 家蚕全基因组 甲基化图谱 谱 研究材料: 家蚕丝腺组织 测序策略: WGBS 研究成果 1、家蚕基因组中约 0.11% 胞 嘧 啶 是 甲 基 化 的,主要发生在CG二核 苷酸区域。 2、与先前报道的拟南芥 和人相比,昆虫甲基化 水平较低。 3、甲基化的CG富集在 基因区,并且和基因表 达水平呈正相关。 4 WGBS可以用来对甲 基化水平比较低的物种 进行甲基化研究。 蚂蚁全基因组甲基化图谱 Genome-wide and Caste-Specific DNA Methylomes of the Ants Camponotus floridanus and Harpegnathos saltator. Current Biology. 2012, 22(19):1755-1764. 纽约大学医学院 华大基因 研究目的 绘制全基因 组甲基化图 蚂蚁全基因组 甲基化图谱 谱 研究成果 实验设计 研究材料: 佛罗里达弓背蚁 (Camponotus floridanus)和印度 跳蚁 (Harpegnathos saltator) 测序策略: WGBS、RNA-seq、 small RNA sequencing 1、在蚂蚁不同发育阶段, 非CpG位点也发生了甲 基化,之前仅在具有很 高甲基转移酶活性的小 鼠和人胚胎干细胞中发 现过 2 、 蚂 蚁的 DNA 甲 基 化 多发生在转录活跃基因 的外显子区域 ,可能与 可变剪切相关 3、某些基因位点发生了 单等位基因甲基化 ,哪 个等位基因发生甲基化 取决于蚂蚁的社会等级 绘制旋毛线虫甲基化图谱 Differential DNA methylation in discrete developmental stages of the parasitic nematode Trichinella spiralis. Genome Biology. 2012,13:R100. 吉林大学 华大基因 实验设计 研究目的 对线虫基因组中的 DNA甲基化现象进 行研究和证实。 首次在旋毛线虫中证实 了DNA甲基化的存在。 研究材料:新生虫(NBL ), 幼虫(ML)和成虫(Ad) 策略:DNA甲基化试剂盒 处理基因组DNA后利用 Hiseq测序Ad、ML、NBL 分别获得61.65、23.52 和 55.77 M的 raw reads; RNA-seq测序Ad、ML、 NBL分别获得28.66、 26.13和28.96M raw reads ;RT-PCR验证。 研究成果 1. 首次证实了在旋毛线虫中存 在DNA甲基化。 2. 在旋毛线虫中存在dnmt3酶, 而这种酶在其他线虫种类中则未 曾发现。 3. 旋毛形线虫从出生到成熟的 转变期间,DNA甲基化出现了显 著上调,且偏重于调控寄生状态 的基因。 4.旋毛线虫中DNA甲基化水平与 基因表达量没有线性相关性,但 可能与基因的可变剪切有关系。 番茄全基因组甲基化图谱 Single-base resolution methylomes of tomato fruit development reveal epigenome modifications associated with ripening. Nature biotechnology. 2013, 31:154-159. 研究成果 美国康奈尔大学 研究目的 绘制全基因 组甲基化图 番茄成熟过程中 谱 的表观调控机制 研究 实验设计 研究材料: 不同发育阶段野生型番 茄;cnr、rin敲除突变 体 测序策略:WGBS、 Strand-specific RNA sequencing、 small RNA sequencing、ChIPseq Illumina GAIIx HiSeq2000 1、确定了52,095个差异甲 基化的区域(相当于1%的 基因组) 2、重要的成熟转录因子之 一RIN的结合位点常位于 众多番茄成熟基因启动子 的去甲基化区域 3、在果实发育过程中,表 观基因组不是一成不变的, 极有可能是通过选择确保 诸如成熟等发育过程的精 确度 3. 酶切位点相关DNA 标签测序技术 (RAD tag sequencing, RAD-seq) RAD-seq文章 PLoS One. 2008;3(10):e3376 Rapid SNP discovery and genetic mapping using sequenced RAD markers. Institute of Molecular Biology, University of Oregon, United States of America. 研究成果 实验设计 研究材料: 三刺鱼 测序策略: Solexa 半个run(GA) Sbf I/EcoR I 1. 发现三刺鱼13,000多个SNPs。 2. 选择不同限制性内切酶获得不 同密度的分子标记。 3. 建立一套用于混样的 barcoding标签体系。 4. 应用于三刺鱼F2群体(96个F2 子代+亲本)构建遗传图谱。 5. 对决定三刺鱼外侧板甲丢失和 骨盆结构减少的QTL分别进行 定位。 RAD-seq构建遗传图谱和QTL定位 Baxter等(PLoS one,2011)通过对小菜蛾的22个BC1个体(回交1代群体)和2个亲本进 行RAD-Seq测序将小菜蛾多杀菌耐药性(孟德尔性状)定位到W/Z性染色体上,并利用 2,878个RAD alleles构建连锁图谱,获得31个连锁群。 Chutimanitsakun等(BMC genomics,2011 )利用RAD标签测序技术对93株大麦DH(双 单倍体)群体进行研究,获得530个SNP markers,应用其中的445个SNP,结合之前的 marker构建了大麦连锁图谱,并对生殖适度形状进行了QTL定位分析。 Pfender等(Theor Appl Genet,2011)对一个多年生黑麦草F1群体的193个体进行RAD标 签测序,并结合SSR和STS分子标记,利用双假测交原理进行连锁分析,构建了遗传连 锁图谱并检测到三个黑麦草抗杆锈病QTL。 Andolfatto等(Genome Rearch,2011)和Elshire等(PLoS one,2011)分别对RAD标签测 序进行了技术改进,并分别在线虫F1回交群体、玉米重组自交系群体、和大麦DH群体 中得以成功应用。 羽扇豆RAD-Seq鉴定抗炭疽病连锁标记 Application of next-generation sequencing for rapid marker development in molecular plant breeding: a case study on anthracnose disease resistance in Lupinus angustifolius L. BMC Genomics. 2012 Jul 17;13:318. 澳大利亚农业与食品部 研究成果 华大基因 1.发现了8207个SNP分子标记; 实验设计 研究目的 开发羽扇豆分子标 记,找到抗性基因 近距离标记以用于 抗病分子遗传育种。 研究材料: 94 个RIL群体 (2个亲本+ 92个子 代) 测序策略: illumina PE91 RAD 测序 每个个体0.8X左右 2.得到与Lanr1连锁共显性标记 38个; 3.从38个标记中随机挑选5个候 选标记转化为共显性PCR标记。 4、用新PCR标记对186个F8后 代分型,与表型数据相结合,发 现五个标记均与Lanr1连锁,比 先前发现的Lanr1基因连锁标记 要近很多。 4、转录组测序(RNA-seq) 转录组:指细胞中含有poly-A的mRNA片段的集合;即真核生物细胞中的mRNA。 • 基因功能注释 • 基因GO分类 • 基因代谢通路分析 28 新转录本分析 基因结构优化 鉴定可变剪切 基因表达定量 Ref RNA-seq:家蚕转录组测序文章 PLoS One. 2012;7(8):e43713. Epub 2012 Aug 23. Transcriptome Analysis of the Silkworm (Bombyx mori) by High-Throughput RNA Sequencing. 中国农科院张志芳研究员 家蚕 (秀丰X白羽):卵、幼虫、一龄虫到四龄虫、中期虫、蜕皮虫。 分别提取total RNA,每样10ug RNA混合,mRNA分离,250bp文库。 RNA-seq:PE100,3.3Gb;7X基因组(432Mb);100X转录组。 RNA-seq所得reads Map到参考基因 组数据,得23461个转录本,其中 5428个新转录本。 SlikDB中14623个注释基因,11884 个(81.3%)在本测序中被发现表达。 GenBank的 ESTdb中收录的家蚕 ESTs中,86.8%序列在RNA-seq中 出现;但RNA-seq所得转录本中 39.6% 不存在家蚕ESTdb中。 直系同源基因簇(COG)数据库分类注释 在NCBI上,BLASTX搜索,共发现16740条unigenes匹配上已知蛋白序列。 将unigenes 在Cluster of Orthologous Groups (COG) 数据库中进行同源基因簇归类, “general function prediction”分类簇[R]最大( 19.6%), “replication, recombina-tion and repair’’分类簇[L]次之( 12.2%的unigenes )。 新外显子的发现 6个候选 外显子 1个候选 外显子 总计鉴定出62084个剪切位点,97.6%的位点为 Class I type (GT-AG/CT-AC)。 共发现13159个新外显子,其中5911个存在于已有注释的基因( SilkDB )中, 这些基因中可能含有家蚕基因组注释过程时所遗漏的外显子。 可变剪切分析:发现3247个基因具有可变剪切体。 Fig 4. Examples of alternative splicing detected in the silkworm transcriptome displayed using GBrowse in the SilkTransDB database. (A) Alternative first exon of the CUFF.6110. (B) Multiple skipped exons of CUFF.13107. (C) Retained intron of the CUFF.12626. (D) Single skipped exon of CUFF.5585. (A):第一外显子选择。(C):内含子保留。 (B)与(D)外显子跳跃。 新基因的不同组织不同发育时期表达模式分析 头部,后部丝腺,中肠,翅膀,复眼,3天大5龄幼虫脂 肪体,蛹期脂肪体,精巢,卵等等。 7个基因,定量RT-PCR实验, BmActin3为内参基因, 3次生物重复。 家蚕转录组数据库的构建 http://124.17.27.136/gbrowse2/ 为了便于数据分析,作者建 立了一个整合了本研究所得 转录组数据和家蚕基因组数 据的转录组数据库,并对公 共开放,网址为: http://124.17.27.136/gbrowse2/。 第一次使用高通量RNA测 序技术来阐述家蚕的转录组。 本工作数据暗示家蚕的转 录组比先前料想的要复杂得 多。 本研究为鉴定新功能成分 提供了工具和资源,并为将 来的功能基因组研究做出了 铺垫。 Figure 6. Screen shot of the interface of the SilkTransDB. Ref RNA-seq: 白菜转录组测序分析 Genomics. 2012 May;99(5):299-307. 研究材料:中国”福山包头”大白菜。 RL:莲座期 (Rosette stage) ,植株有8-10片展开叶,茎尖以下5mm取样; FL:结球期 (Folding stage) ,有23-24片展开叶,开始折叠的幼叶,茎尖以下5mm取样。 每个发育时期,从15株植株取样后,混合,液氮冷冻。 提取RNA,构建300bp文库,Illumina HiSeq™ 2000 90PE测序。 Reads的mapping分析 SOAP2 软件(容许2个碱基错配);70.6%的reads可比对上reference genome; 约60% 可比对上unique genes (Annotated exons from of cabbage genome) 。 DEGs的GO分析 两个发育时期有2255个差异表达基因 (FDR≤ 0.001 且log2 Ratio≥ 1) 植物发育相关基因 转录本的可变剪切分析 A3SS: Alternative 3‘ splice site,形成不同的转录本,5’端剪接位点一致但3‘端位点不同。 A5SS: Alternative 5‘ splice site,形成不同的转录本,3’端剪接位点一致但5‘端位点不同。 SE: Exon Skipping,外显子跳跃。 RI: Intron retention,内含子保留。 可变剪接在真核生物中普遍存在,可使一个基因产生多个mRNA转录本,翻译成不同蛋白,增加了蛋白多样性。 RT-PCR证实RL与FL中Bra039214的可变剪切体 内含子保留 1682 bp 选择3’端剪切位点 1542 bp 组成性表达 1011 bp Real-time quantitative PCR 验证 De novo RNA-seq: 中华绒螯蟹附性腺与精巢比较转录组研究 中华绒螯蟹(大闸蟹): 上海金山区漕泾镇商业蟹场,购买健康、性成熟、处于附性腺(ASG)快速发育 期的雄性个体(150-200g),3个池子各取3只,共9只蟹剥取9对 ASG(Accessory Sex Gland),液氮冷冻。 ASGs样本混合,提取RNA,Illumina HiSeq 2000 PE90测序,方法同前文: He L, Wang Q, Jin X, Wang Y, Chen L, et al. (2012) Transcriptome Profiling of Testis during Sexual Maturation Stages in Eriocheir sinensis Using Illumina Sequencing. PLoS ONE 7: e33735. De novo组装流程图( SOAPdenovo-v1.03) 组装结果一览 本次ASG测序 2.66 G(上次T组织测序2.32G),组装得37955个unigenes。 Unigenes长度分布 Unigenes的GO基因本体分类分析 Unigenes的COG同源基因簇分类分析 Unigenes的KEGG注释(225个中前30个代谢途径) 两种组织Unigenes中的生殖相关基因 两种组织Unigenes的表达差异分析 DEG分析,其中, 26653条unigenes在testis中特异表达; 631 条unigenes特异在ASG中表达。 De novo RNA-seq: 萝卜转录组测序文章 材料:潍县青萝卜 播种后7天,早苗期根 (roots at the early seedling stage, RESS); 播种后20天,晚苗期根(roots at the late seedling stage RLSS),皮质分裂期; 收获下胚轴(1cm)和真根(1cm)。 从10个幼苗上取样,混合后提取RNA。 20 ug RNA,建库, Illumina PE90 测序。 Trinity组装与TGICL分析 TIGR Gene Indices Clustering (TGICL) 2个转录组测序,Clean data 总计 9.65 Gb数据量。 利用高质量reads,RESS和RLSS分别组装出110,973 和115,315 条contigs。 使用PE reads,检测来自同一个转录本的contigs,组装成unigenes。 两个库的unigenes,混合、组装、去冗余, 得到non-redundant unigenes。 Contig和Unigenes的长度分布 • • 两个文库的contig和unigenes长度分布高度一致,暗示illumina测 序重复性和可靠性比较高。 在All unigenes中,15,115 (24.56 %) 长度在 500-1000bp之间, 有17,248(28.02 %)长于1000 bp。 测序覆盖深度影响编码区覆盖度 61,554条unigenes中53,541 (86.98 %) 可以map白菜基因组中编码区, 但大部分未能cover到基因的完整编码区。 覆盖深度>300时,66.86%(1,979 out of 2,960)unigenes的编码区覆盖>1; 覆盖深度<300时,仅有32.04%(16,206 out of 50,581) 编码区覆盖>1。 Unigenes的GO分析 21,109 条unigenes 匹配上GO条目。 (在COG和KEGG数据库中注释结果以附表形式存在) 转录本表达差异分析 对DEGs进行了KEGG分析;选择20 个genes进行qRT-PCR验证。 EST-SSRs的开发 MicroSAtellite software (MISA; http://pgrc.ipk-gatersleben.de/misa/) Identification of perfect mono-, di-, tri-, tetra-,penta-, and hexa-nucleotide motifs with a minimum of 12, 6, 5, 5, 4 and 4 repeats, respectively. 不同类型的SSRs分布比率 AG/CT (30.60 %)为最大的EST-SSRs类型。 5、数字基因表达谱测序 (digital gene expression-DGE) 59 DGE:从全转录组水平对mRNA的表达进行定量的标签测序技术。 DGE 信息分析 差异表达基因分析方法 1992年,差异显示技术(differential display reversetranscription PCR, DDRT-PCR )。 1994年,代表性差异分析(cDNA representational difference analysis, cDNA-RDA)。 1995年,基因芯片技术,又称 DNA芯片,DNA微阵 列(DNA microarray)。 1995年,基因表达系列分析(Serial Analysis of Gene Expression,SAGE). 1996年,cDNA-AFLP 技术(cDNA Amplified fragment length polymorphism )。 1996年,抑制性消减杂交(Suppression Subtractive Hybridization, SSH )。 2008年,基于NGS的数字基因表达谱技术 (DGE/Tag-seq/Tag profiling)。 有参考基因组:DGE比较中西方母猪 研究背景 二花脸(ER)母猪,中国太湖猪品种,繁殖性能高、每窝仔畜数多。 妊娠12天(GD12),子宫内膜分泌子宫营养质,影响猪胚胎生长发育。 太湖猪在GD12时胚胎死亡率低于西方母猪。 动物和组织收集: 3头长白×大约克夏(LL)杂交母猪; 3头二花脸(ER)母猪。 人工授精;GD12屠宰;取子宫内膜组织;液氮冻存。 DGE测序: 分别提取RNA,3头LL母猪RNA等量混合,3头ER母猪RNA混合; 两个RNA池分别取出6ug,用于文库构建及Illumina测序分析。 ER和LL文库分别测得3.7M 与5.7M 的tags; 分别得到400769和493761条unique tags。 低拷贝tags(CopyNum<5)具有很大的序列多样性。 测序tags的饱和性分析 13,612个差异表达基因的GO分析 qRT-PCR验证 胚胎生长和PG(前列腺素)合成相关候选基因一览 有参考基因组:DGE分析水淹黄瓜根部表达谱 Genomics 2012 Mar;99(3):160-8. 研究材料:黄瓜耐涝品系‘早二N’。 处理与取样:黄瓜三真叶期,水淹胁迫处理24h, 过程中的5个时间点(处理后0、2、4、8、24h)取根部。 Tags-seq测序:文库命名分别为 R1, R2, R3, R4,和 R5。 数据统计 每个文库测得约6M原始tags,去杂后每个文库得到约5.8M的total clean tags,和约0.14M的 distinct clean tags。 23.69%–29.61% 的distinct clean tags 比对到黄瓜unigenes数据库。 53.78%–60.66%能比对到黄瓜基因组数据库。 tags拷贝数分布 • • • 5个文库的total clean 和distinct clean的tags拷贝数分布趋势高度相似。 在distinct clean tags中:6% 拷贝数大于100;32% 在5到50个拷贝数之间; 60%在2到5拷贝之间。 R4文库所得tags比其它文库要多,该时间点有更多低丰度基因表达。 差异表达基因分析 • • • 5个文库数据均一化后两两对比分析,有5787个基因至少在一对比较中差异表达。 与对照相比,1180个基因 2h处理点差异表达, 其中下调表达基因为629个,占53.3%。 在4h、8h和24h处理点黄瓜根中也是大部分的基因表现为下调表达。 R5与R1进行比较,对差异表达基因在GO数据库中进行功能分类分析。 代谢进程、细胞代谢、初始代谢、大分子代谢等相关基因大量富集。 26%的差异基因 归类于“response to stimulus”;13%的差异基因归类于“response to stress”。 部分差异表达基因的列表 差异表达基因的KEGG分析 (P-value<0.05) 糖酵解(glycolysis) 途径(低氧胁迫标志) 相关基因的表达量明 显上升。 柠檬酸(Citrate)循环, 泛酸盐(pantothenate) 和辅酶A(CoA)代谢,脂 肪酸代谢和乙醛酸 (glyoxylate)等相关基因 表达下调。 水浸胁迫影响蔗糖(sucrose)和淀粉(starch)代谢 胁迫下,黄瓜根中淀粉分支酶和蔗糖合成酶基因表达下降。 而糖酵解和发酵作用相关基因受胁迫诱导表达上升。 如此减速蔗糖和淀粉的合成,而加速其分解代谢,导致胁迫5天后黄瓜根中可溶性糖含量下降。 定量PCR验证DGE数据 选择9个基因进行qRT-PCR分析(actin为内参),除2个基因【H 与 I】外, 其它基因经qRT-PCR与Tags-seq分析的表达模式相一致。 标签测序技术tags对比策略 有参考基 因组物种 无参考基 因组物种 表达谱/DGE: tags比对参考基因/基因组数据库。 转录组测序/ RNA-seq: De novo组装得Unigenes集; 表达谱/DGE:tags 比对Unigenes集。 无参考基因组:蜜蜂“RNA-seq+DGE”文章 PLoS One. 2012;7(10):e47954. 中华蜜蜂(Apis cerana cerana):江西农业大学蜜蜂研究院。 转录组样品:生长期3天的工蜂幼虫;生长期为1天的工蜂蛹;生长期为 1天的工蜂成虫,采蜜蜂成虫,授奶蜂成虫(每组5个样本);5份RNA 等量混合,取20ug RNA。 取样目的:得到较全面A. c. cerana转录本序列信息。 DGE样品:两个样本,1个为5只刚孵化的工蜂;1个为5只刚孵化的蜂后; 取样时期:胚后发育的终点,种族特异性的起点,研究蜜蜂种族特异性 分子机制的重要时期。 • Illumina测序得到 51.6M 条clean reads(4.64Gb); • De novo组装得到46,999条unigene,平均长度为676bp。 Unigenes的长度分布 长度在1000bp以上的unigenes有9114条。 unigenes 的功能注释 通过与NR,Swissprot,GO,COG和KEGG五个数据库比对,24,630条unigenes (52.4% of all unigenes)得到注释, 24,001 unigenes 由NCBI (51.07%)注释, wissProt, KEGG, COG, GO 这4个数据库的注 释率分别为18,138 (38.59%), 15607 (33.21%), 7860 (16.72%), and 8064 (17.16%) Unigene的GO注释 Unigenes的COG分析 24,630条得到注释的unigenes 中有7860条得到了COG注释结果。 DGE测序数据统计 蜂后和工蜂DGE文库中拷贝数大于100的tags所占比例 高于84%,而这些高拷贝tags的种类在7%以下。 qRT-PCR验证 二者间找到414个差异表达的基因,189个表达量上调,225个表达下调。 挑选10个差异表达基因进行qRT-PCR检测,检测结果与DGE结果一致。 无参考基因组:香蕉“RNA-seq+DGE”文章 中国热带农业科学院 研究背景: 香蕉和大蕉因其营养和出口价值成为世界上最重要的作物之一。 香蕉的农业生产严重受到真菌尖孢镰刀菌古巴专化型(Foc)的侵染和破坏, 且无有效手段防止和控制该病害。 现在Foc侵染的分子机制相关认知甚少。 本研究联合应用转录组测序和DGE表达谱分析了香蕉根的转录组和调查 Foc TR4侵染后香蕉基因表达的响应变化情况。 转录组测序与De novo组装 取样:从尖孢镰刀菌(Foc TR4)侵染香蕉第0天、2天、4天和6天 的香蕉根中提取总RNA。 测序:RNA等量混合,构建一个cDNA文库, PE90 测序,得到 26M 的高质量reads,2.4Gb数据量。 De novo组装:SOAP de novo-Oases组装,得到25158条 unigenes,平均长度为1439bp。 在各数据库中注释结果 在组装得到25158条unigenes中,总计有21622条unigenes可被注释。 77.4% 98.8% 在Nr库中blastX搜索时,unigenes越长,得到有意义结果(1e-5)的可能性越大。 Unigenes的GO功能分类 使用BLAST2GO,共17540条unigenes被注释到10428个GO条目中, 图中展示45个GO 亚类别。 DGE测序分析 Foc TR4 侵染香蕉,0天、2天、4天、6天,根RNA的提取,4个DGE测序。 分别得3.57M, 3.52M, 3.79M和3.50M 条 total tags; 366382, 384048, 335285,和297960 个distinct tags。 DGE测序tags比对与基因差异表达分析 DGE所得tags比对转录组测序unigenes集 病毒感染后2、4、6天分别与0天进行比较,分别鉴定出4279、5078和5531个 差异表达基因,对这些序列进行了GO和KEGG数据库搜索。 分析显示Foc TR4的侵染影响了香蕉根中苯丙氨酸代谢、苯丙素苷类化合物生物 合成和α-亚麻酸代谢途径相关基因的表达。 6、小RNA测序技术 Small RNA:长度18-40nt非编码RNA,调控基因表达。 Small RNA测序建库流程 生物信息分析 中国秦川牛背最长肌的miRNA鉴定 Identification and profiling of conserved and Identification and profiling of conserved and novel microRNAs from Chinese Qinchuan bovine longissimus thoracis. BMC Genomics. 2013, 14:42. 西北农林科技大学 研究成果 实验设计 研究目的 鉴定秦川牛背最 长肌的miRNA谱。 研究材料: 胎小牛和成年牛的 背最长肌RNA,分 离小RNA,进行测 序。 测序策略: miRNA测序 Solexa SBS测序 1、鉴定出417个已知 miRNA和104个新RNA。 2、不同组织及不同胚 胎时期的miRNA表达水 平不同。 3、小RNA影响了牛的 肌肉组织细胞的生长。 小RNA的长度分布 成年牛和小牛中miRNA差异表达 RT-qPCR鉴定不同组织中牛mi-RNA的表达水平 不同组织及不同胚胎时期的miRNA表达水平不同, 表明这些小RNA影响牛肌肉组织细胞的生长。 中科院遗传发育所王秀杰研究员油菜小RNA测序 Plant Physiol. 2012 Feb;158(2):813-23. Small RNA Profiling in Two Brassica napus Cultivars Identifies MicroRNAs with Oil Production- and Development-Correlated Expression and New Small RNA Classes. • 材料:高含油和低含油品种,种子发育的3天、7天、14天和21天的小RNA表达谱。 • 结果:鉴定50个保守的miRNA;11个新的miRNA;鉴定出一些新miRNA 靶基因; 发现大量长度为23-nt的具有特定核苷酸组成偏好性的小RNA,可能是新的小RNA 功能分类 。 国内2012年发表小RNA测序文章(部分) PLoS One 2012;7(1):e30988. (伪狂犬病毒侵染家猪上皮细胞系)华中农大 Pseudorabies virus infected porcine epithelial cell line generates a diverse set of host microRNAs and a special cluster of viral microRNAs. PLoS One. 2012;7(2):e31426. Epub 2012 Feb 15. (大白和梅山猪背膘 )华中农大 Solexa sequencing identification of conserved and novel microRNAs in backfat of Large White and Chinese Meishan pigs. PLoS One 2012;7(6):e38716. Epub 2012 Jun 12. (二花脸和大白猪) 南京农大 Coordinated miRNA/mRNA Expression Profiles for Understanding Breed-Specific Metabolic Characters of Liver between Erhualian and Large White Pigs. Reprod Domest Anim. 2012 May 31. doi: 10.1111/j.1439-0531.2012.02040.x. (猪胚胎) 吉林大学 Identification and Characterization of Pig Embryo MicroRNAs by Solexa Sequencing. Anim Genet. 2012 Feb 27. doi: 10.1111/j.1365-2052.2012.02332.x. (猪骨骼肌和脂肪组织) 华南农大 Identification and comparison of microRNAs from skeletal muscle and adipose tissues from two porcine breeds. PLoS One. 2012;7(8):e43741. Epub 2012 Aug 24. (断奶小猪) 扬州大学 Analysis of Differential miRNA Expression in the Duodenum of Escherichia coli F18-Sensitive and -Resistant Weaned Piglets. PLoS One. 2012;7(12):e52256. (小型猪牙胚)首都医大 MicroRNAome and expression profile of developing tooth germ in miniature pigs. 国内2012年发表小RNA测序文章(部分) PLoS One. 2012;7(12):e52123. (家猪骨骼肌) 南京农大 Discovery of MicroRNAs associated with myogenesis by deep sequencing of serial developmental skeletal muscles in pigs. PLoS One. 2012;7(8):e43691. (家猪母乳液) 四川动物所 Lactation-related microRNA expression profiles of porcine breast milk exosomes. Mol Biol Rep.2012 Jul 5. (奶山羊乳腺)山东农大 Identification and characterization of microRNA in the dairy goat (Capra hircus) mammary gland by Solexa deep-sequencing technology. BMC Genomics. 2012 Oct 16;13:555. (驼羊皮) 山西农大 Identification and characterization of microRNAs in white and brown alpaca skin. PLoS One. 2012;7(12):e52388. (奶山羊) 西北农林大 Comparative transcriptome profiling of dairy goat microRNAs from dry period and peak lactation mammary gland tissues. PLoS One. 2012;7(12):e50001. (绒山羊外皮) 内蒙古农大 Identification of conserved and novel microRNAs in cashmere goat skin by deep sequencing. BMC Genomics. 2012 Dec 27;13:731. (牛乳腺) 浙江大学 Expression profiles of microRNAs from lactating and non-lactating bovine mammary glands and identification of miRNA related to lactation. BMC Genomics. 2012 Aug 21;13:413. (鲤鱼) 中国水产科学院 Identification of common carp (Cyprinus carpio) microRNAs and microRNA-related SNPs 国内2012年发表小RNA测序文章(部分) RNA Biol. 2012 Feb 1;9(2). (鸡早期发育胚胎)中山大学 Drastic expression change of transposon-derived piRNA-like RNAs and microRNAs in early stages of chicken embryos implies a role in gastrulation. Genomics. 2012 Feb 20. (鸡骨骼肌)北京大学 Identification of long non-protein coding RNAs in chicken skeletal muscle using next generation sequencing. Genet Mol Res. 2012 Dec 21;11(4):4682-94. (家鸡下丘脑) 河南农大 Identification and abundance of miRNA in chicken hypothalamus tissue determined by Solexa sequencing. PLoS One. 2012;7(3):e32860. Epub 2012 Mar 6. (褐飞虱)华中农大 Characterization and comparative analysis of small RNAs in three small RNA libraries of the brown planthopper (Nilaparvata lugens). Genomics. 2012 Mar 8. [Epub ahead of print] (东亚三角涡虫)郑州大学 Identification of small non-coding RNAs in the planarian Dugesia japonica via deep sequencing PLoS One. 2012;7(12):e53387. 兰州兽研所 (肝吸虫) Comparative characterization of microRNAs from the liver flukes Fasciola gigantica and F. hepatica. Int J Biol Sci. 2013;9(1):1-15. 上海植生所 (棉铃虫和斜纹夜蛾) Identification of microRNAs in Helicoverpa armigera and Spodoptera litura based on deep sequencing and homology analysis. 国内2012年发表小RNA测序文章(部分) Insect Mol Biol. 2012 Mar 27. doi: 10.1111/j.1365-2583.2012.01135.x. (蜜蜂)浙江大学 Next-generation small RNA sequencing for microRNAs profiling in Apis mellifera: comparison between nurses and foragers. Fish Shellfish Immunol. 2012 Feb;32(2):345-52. (颤抖病螺原体感染中华绒螯蟹)南京师大 Identification and comparative analysis of the Eriocheir sinensis microRNA transcriptome response to Spiroplasma eriocheiris infection using a deep sequencing approach. Fish Shellfish Immunol.2012 May 14.(养殖刺参皮肤溃疡综合征)宁波大学 Characterization of skin ulceration syndrome associated microRNAs in sea cucumber Apostichopus japonicus by deep sequencing. Plant Physiol. 2012 Apr 17. [Epub ahead of print] (低温胁迫小麦)华中农大 Uncovering small RNA-mediated responses to cold stress in a wheat thermosensitive genic male sterile line by deep sequencing. New Phytol. 2012 Apr 27. doi: 10.1111/j.1469-8137.2012.04154.x. (砷酸盐胁迫水稻) 中山大学 Comparative transcriptome analysis of transporters, phytohormone and lipid metabolism pathways in response to arsenic stress in rice (Oryza sativa). Plant Mol Biol. 2012 Mar 9. [Epub ahead of print] (水稻雄配子体发育)四川大学 MicroRNA profiles and their control of male gametophyte development in rice. New Phytol. 2012 Nov;196(3):914-25. (野生稻) 浙江大学 Genomic dissection of small RNAs in wild rice (Oryza rufipogon): lessons for rice domestication. 国内2012年发表小RNA测序文章(部分) BMC Genomics. 2012 Apr 6;13(1):132. [Epub ahead of print] (高山松)中科院植物所 Transcriptome-wide identification and characterization of miRNAs from Pinus densata. Planta. 2012 Apr 13. [Epub ahead of print] (落叶松)北京林科院 Genome-wide identification of microRNAs in larch and stage-specific modulation of 11 conserved microRNAs and their targets during somatic embryogenesis. Planta. 2012 May;235(5):873-83. (病原菌胁迫胡杨) 北京林大 Genome-wide profiling of novel and conserved Populus microRNAs involved in pathogen stress response by deep sequencing. Biochem Biophys Res Commun. 2012 Jan 13;417(2):892-6. (低温胁迫毛白杨) 北京林大 Genome-wide identification of cold-responsive and new microRNAs in Populus tomentosa by high-throughput sequencing. Gene. 2012 May 24. [Epub ahead of print](热激毛白杨)北京林大 Genome-wide identification and expression analysis of heat-responsive and novel microRNAs in Populus tomentosa. Funct Integr Genomics. 2012 Mar 14. (水份胁迫大白杨)北京林大 Identification of novel and conserved Populus tomentosa microRNA as components of a response to water stress. Biochimie. 2012 Nov 6. pii: S0300-9084(12)00441-5. (盐胁迫毛白杨) 北京林大 Identification and characterization of salt-responsive microRNAs in Populus tomentosa by high-throughput sequencing. 国内2012年发表小RNA测序文章(部分) Planta. 2012 Dec 12. [Epub ahead of print] (落叶松) 中国林科院 A genome-wide survey of microRNA truncation and 3' nucleotide addition events in larch (Larix leptolepis). PLoS One. 2012;7(8):e43451.南京林大 黄杨 Deep sequencing and microarray hybridization identify conserved and species-specific microRNAs during somatic embryogenesis in hybrid yellow poplar. Int J Mol Sci. 2012;13(3):2973-84. Epub 2012 Mar 6. (大麦)西北农林大学 Identification and Characterization of MicroRNAs from Barley (Hordeum vulgare L.) by High-Throughput Sequencing. PLoS One. 2012;7(6):e39650. (胞囊线虫感染大豆)中科院北京基因组所 Identification of Soybean MicroRNAs Involved in Soybean Cyst Nematode Infection by Deep Sequencing. BMC Plant Biol. 2012 Oct 5;12:182. doi: 10.1186/1471-2229-12-182.华南农大 铝胁迫大豆 Identification of wild soybean miRNAs and their target genes responsive to aluminum stress. Planta. 2012 Feb;235(2):375-86. (蒺藜苜蓿) 中科院植物所 Identification of aluminum-responsive microRNAs in Medicago truncatula by genome-wide high-throughput sequencing. Plant Sci. 2012 Mar;184:14-9. (蒺藜苜蓿) 中科院植物所 Ethylene-responsive miRNAs in roots of Medicago truncatula identified by high-throughput sequencing at whole genome level. 国内2012年发表小RNA测序文章(部分) Physiol Plant. 2012 May 18;9999(999A). (涝水玉米苗) 华中农大 Genome-wide identification and analysis of microRNA responding to long-term waterlogging in crown roots of maize seedlings. BMC Genomics. 2012 Aug 1;13(1):360. (玉米种子) 中国农大 Characterization of microRNAs expression during maize seed development. PLoS One. 2012;7(6):e39578. (玉米种子萌发中杂交优势)河南农大 MicroRNA Transcriptomic Analysis of Heterosis during Maize Seed Germination. Genomics. 2012 Nov 10. pii: S0888-7543(12)00212-1. (玉米支持根) 山东农大 Transcript profiling of microRNAs during the early development of the maize brace root via Solexa sequencing. PLoS One. 2012;7(11):e50870. (拟南芥) 杭州师大 Expression-based functional investigation of the organ-specific microRNAs in Arabidopsis. PLoS One. 2012;7(11):e48951. (氮胁迫拟南芥) 西双版纳植物园 Identification of nitrogen starvation-responsive microRNAs in Arabidopsis thaliana. PLoS One. 2012;7(2):e31163. (拟南芥和水稻)华中师大 Large-scale identification of mirtrons in Arabidopsis and rice. PLoS One. 2012;7(10):e46443. (病毒感染的水稻) 浙江农科院 Identification of novel Oryza sativa miRNAs in deep sequencing-based small RNA libraries of rice infected with Rice stripe virus. 国内2012年发表小RNA测序文章(部分) J Exp Bot. 2012 Jul 6. [Epub ahead of print](镉处理油菜)南京农大 Genome-wide identification of Brassica napus microRNAs and their targets in response to cadmium. BMC Genomics. 2012 Jan 9;13:7. (西红柿果实3个成熟时期)中国农大 Sculpting the maturation, softening and ethylene pathway: the influences of microRNAs on tomato fruits. PLoS One. 2012;7(3):e33040. Epub 2012 Mar 30. (黄瓜不同组织)浙江大学 A Combined Approach of High-Throughput Sequencing and Degradome Analysis Reveals Tissue Specific Expression of MicroRNAs and Their Targets in Cucumber. Gene. 2012 Apr 10. [Epub ahead of print] (土沉香)北京药用植物所 Identification of conserved and novel microRNAs in Aquilaria sinensis based on small RNA sequencing and transcriptome sequence data. Physiol Plant. 2012 Oct 15. doi: 10.1111/j.1399-3054.2012.01713.x. (草莓) 北京农学院 Deep sequencing discovery of novel and conserved microRNAs in strawberry (Fragaria×ananassa). Comp Funct Genomics. 2012;2012:912843. (条斑紫菜孢子体和配子体) 青岛海洋所 Comparative Analysis of MicroRNAs between Sporophyte and Gametophyte of Porphyra yezoensis PLoS One. 2012;7(9):e44696. (鹅掌楸花) 武汉植物园 Identification of conserved and novel microRNAs from Liriodendron chinense floral tissues BMC Genomics.2012 Mar 29;13(1):122. (山葡萄)南京农大 Identification of microRNAs from Amur grapes (Vitis amurensis Rupr.) by deep sequencing and analysis of microRNA variations with bioinformatics. 国内2012年发表小RNA测序文章(部分) BMC Plant Biol. 2012 Feb 22;12:28. (烟草去顶和伤害)浙江大学 Identification of wounding and topping responsive small RNAs in tobacco (Nicotiana tabacum). J Exp Bot. 2012 Jan;63(2):1025-38. (热处理白菜)中科院上海植生所 Identification of conserved and novel microRNAs that are responsive to heat stress in Brassica rapa. Mol Genet Genomics. 2012 May 29. (白菜)山东农科院 High-throughput sequencing discovery of conserved and novel microRNAs in Chinese cabbage (Brassica rapa L. ssp. pekinensis). Planta. 2012 Apr 6. [Epub ahead of print] (山核桃)浙江农林大学 Discovery and profiling of novel and conserved microRNAs during flower development in Carya cathayensis via deep sequencing. in tobacco (Nicotiana tabacum). Physiol Plant. 2012 Jun 18;9999(9999). (紫杉)大连交大 Identification of Taxus microRNAs and their targets with high-throughput sequencing and degradome analysis. PLoS One. 2012;7(9):e44385. (人参) 北大医学院 High-throughput sequencing and characterization of the small RNA transcriptome reveal features of novel and conserved microRNAs in Panax ginseng. PLoS One. 2012;7(8):e43760. (早花突变的枳) 华中农大 Identification and comparative profiling of miRNAs in an early flowering mutant of trifoliate orange and its wild type by genome-wide deep sequencing. 国内2013年发表小RNA测序文章(部分) PLoS One. 2013;8(2). doi: 10.1371/ 山东农大 (奶山羊乳腺) Identification of Novel and Differentially Expressed MicroRNAs of Dairy Goat Mammary Gland Tissues Using Solexa Sequencing and Bioinformatics. BMC Mol Biol. 2013 Feb 18;14(1):7. [Epub ahead of print] 四川农大 (家猪骨胳肌) Identification of differences in microRNA transcriptomes between porcine oxidative and glycolytic skeletal muscles. Gene. 2013 Feb 4. pii: S0378-1119(13)00100-5. 广东海洋大学 (鸭子羽囊和皮肤) MicroRNA profile analysis on duck feather follicle and skin with high-throughput sequencing technology. BMC Genomics. 2013 Jan 18;14:42. doi: 10.1186/1471-2164-14-42.西北农林大学 (秦川牛胸最长肌) Identification and profiling of conserved and novel microRNAs from Chinese Qinchuan bovine longissimus thoracis. Parasit Vectors. 2013 Jan 25;6(1):25. [Epub ahead of print]兰州兽研所 (胰阔盘吸虫) Identification and characterization of microRNAs in the pancreatic fluke Eurytrema pancreaticum. PLoS One. 2013;8(1):e54174. doi: 10.1371/journal.pone.0054174. 南京师大 (斑点叉尾鮰) Identification and characterization of microRNAs in channel catfish (Ictalurus punctatus) by using Solexa sequencing technology. Vet Res. 2013 Jan 18;44(1):3. [Epub ahead of print]四川农大 (犬恶丝虫) Identification of Dirofilaria immitis miRNA using illumina deep sequencing. Mol Biol Rep. 2013 Jan 12. [Epub ahead of print] 山东理工 (三角涡虫) Deep sequencing identifies regulated small RNAs in Dugesia japonica. 国内2013年发表小RNA测序文章(部分) Plant Mol Biol. 2013 Feb 22. [Epub ahead of print] 北京林大 (盐胁迫胡杨) Global identification of miRNAs and targets in Populus euphratica under salt stress. J Exp Bot. 2013 Feb 4. [Epub ahead of print] 华中农大 (棉花胚胎发生) Small RNA and degradome sequencing reveal complex miRNA regulation during cotton somatic embryogenesis BMC Genomics. 2013 Jan 31;14(1):66. [Epub ahead of print] 华南农大 (低磷胁迫大豆) Genome-wide identification of soybean microRNAs and their targets reveals their organ-specificity and responses to phosphate starvation. PLoS One. 2013;8(1):e54148. 河南农大 (灌浆期谷粒) Characterization and Expression Patterns of microRNAs Involved in Rice Grain Filling PLoS One. 2013;8(1):e55107. 山东农大 (玉米种子) Deep Sequencing of Maize Small RNAs Reveals a Diverse Set of MicroRNA in Dry and Imbibed Seeds. Int J Mol Sci. 2013 Jan 28;14(2):2717-38. 中科院遗传发育所 (盐胁迫大豆) Identification and Dynamic Regulation of microRNAs Involved in Salt Stress Responses in Functional Soybean Nodules by HighThroughput Sequencing. Plant Sci. 2013 Mar;201-202:108-14. 南京农大 (萝卜) Identification and characterization of novel and conserved microRNAs in radish (Raphanus sativus L.) using high-throughput sequencing. BMC Genomics. 2013 Jan 16;14:9. doi: 10.1186/1471-2164-14-9. 浙江大学 (芥菜雄性不育系与维持系) Identification of miRNAs and their targets using high-throughput sequencing and degradome analysis in cytoplasmic male-sterile and its maintainer fertile lines of brassica juncea. Gene. 2013 Feb 15;515(1):123-7. 湖州师范学院 (拟南芥和水稻) Identification of the highly accumulated microRNA*s in Arabidopsis (Arabidopsis thaliana) and rice (Oryza sativa). 谢谢! yueguidong@genomics.cn