基于高通量测序的野生毛葡萄转录组数据分析

基于高通量测序的野生毛葡萄转录组数据分析

ID:31359861

大小:110.50 KB

页数:7页

时间:2019-01-09

基于高通量测序的野生毛葡萄转录组数据分析_第1页
基于高通量测序的野生毛葡萄转录组数据分析_第2页
基于高通量测序的野生毛葡萄转录组数据分析_第3页
基于高通量测序的野生毛葡萄转录组数据分析_第4页
基于高通量测序的野生毛葡萄转录组数据分析_第5页
资源描述:

《基于高通量测序的野生毛葡萄转录组数据分析》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、基于高通量测序的野生毛葡萄转录组数据分析  摘要:利用RNA-seq技术对所构建的野生毛葡萄(VitisquinquangularisRehd)叶片的转录组进行测定,对原始reads进行过滤和组装,得到了35238条质量较高的unigene,平均长度为1081nt,N50为1735nt。基于NCBI蛋白质数据库(Nr)、蛋白质序列数据库(Swiss-Prot)、京都基因与基因组百科全书(KEGG)数据库和直系同源基因簇(COG)进行相似性比对,共注释了26751条unigene,另有8487条unigene未被注释。物种同源性显示与葡萄的同源性

2、最高为74.48%。利用COG数据库将unigene分成25类,通过GO分类和KEGG富集性分析,将unigene分别归类于44个GO类别和122个代谢途径。此外,在35238条unigene中共搜索到4428个SSR位点,二核苷酸的SSR数目最多(1906条),其次为三核苷酸(1762条)。这些信息为毛葡萄功能基因、相关候选基因的发掘以及分子标记辅助育种提供了重要依据。  关键词:毛葡萄(VitisquinquangularisRehd);转录组;高通量测序  中图分类号:S663.1文献标识码:A文章编号:0439-8114(2016)18

3、-4827-05  DOI:10.14088/j.cnki.issn0439-8114.2016.18.050  野生毛葡萄(Vitisquinquangularis7Rehd)是葡萄科(Vitaceae)葡萄属(Vitis)真葡萄亚属(Euvitis)东亚种群,盛产于中国,是中国葡萄属东亚种群中分布最广的一个野生种[1]。广西壮族自治区作为中国野生毛葡萄之乡和中国野生毛葡萄酒原产地,在桂中、桂北、桂西的喀斯特地貌地区野生毛葡萄较集中。野生毛葡萄含多种维生素、各种氨基酸、矿物质等营养物质,还含有丰富的花色素双糖苷、超氧化歧化酶(SOD)及白藜芦

4、醇(RES)物质,具有软化血管、抗衰老、防癌的作用[2]。多数野生毛葡萄表现抗逆性强、耐病性好、耐南方高温多雨潮湿天气、耐旱耐瘠等优良特性,是南方石漠化治理、生态重建的优良树种,具有重要的经济价值[3,4]。目前对毛葡萄的研究主要集中在栽培技术和杂交育种方面,缺乏对其分子生物学方面的研究,对其基因信息的研究极少。  转录组是在特定发育阶段和一定生理条件下,细胞内所有转录出来的RNA的集合。通过高通量的转录组分析,可以获得机体在生命过程中基因的表达模式[5]。RNA-seq是2008年建立起来的基于深度测序的转录组分析技术,它能够在单核苷酸水平上

5、对任何物种进行整体转录活动的检测,是当前在全基因组水平上研究基因表达模式的主要技术[6]。本研究拟采用RNA-seq技术对所构建的毛葡萄叶片的转录组进行测定,并在基因组水平上进行转录组分析,旨在获得毛葡萄更多的转录本和更为全面的转录组信息,为重要性状相关基因的克隆及功能分析、鉴定次级代谢物生物合成相关基因奠定基础。  1材料与方法  1.1材料7  植物材料为毛葡萄五峒-1,生长于广西壮族自治区河池市都安瑶族自治县高岭镇五峒村,树龄数十年、生长旺盛,叶片生长状况良好,果实产量高,经调查与试验发现其对多种病害高抗或免疫。采集后液氮速冻,并转移至-

6、80℃水箱保存备用。  1.2方法  1.2.1野生毛葡萄测序采取野生毛葡萄的嫩叶并提取总RNA,送至北京诺禾致源生物信息科技有限公司进行文库构建与高通量测序,测序平台为IlluminaHiSeqTM2000,每个样品测序量约为4.75G。  1.2.2测序数据的组装对测序后得到的原始数据totalrawreads进行质量分析,去除重复、含接头、测序质量低的reads,获得cleanreads。使用短reads组装软件Trinity做转录组从头组装[7]。首先将具有一定长度重叠的reads连成更长的片段,通过reads重叠关系得到组装片段con

7、tig。然后将reads比对回contig,通过paired-endreads确定来自同一转录本的不同contig以及这些contig间的距离,Trinity软件将这些contig连在一起,最后得到两端不能再延长的序列,即为unigene。  1.2.3功能注释利用Blastx将unigene序列与Nr(Non-redundantProteinSequenceDatabaseinGenBank)、Swiss-Prot(Swiss-ProtProteinSequenceDatabase)、KEGG(KyotoEncyclopediaofGenes

8、andGenomes)和COG(ClusterofOrthologousGroupsofproteins)数据库进行比对,获取与unigene具有最高

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。