外显子组测序信息分析.ppt

外显子组测序信息分析.ppt

ID:56469211

大小:2.03 MB

页数:32页

时间:2020-06-19

外显子组测序信息分析.ppt_第1页
外显子组测序信息分析.ppt_第2页
外显子组测序信息分析.ppt_第3页
外显子组测序信息分析.ppt_第4页
外显子组测序信息分析.ppt_第5页
资源描述:

《外显子组测序信息分析.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、外显子组测序在医学研究中的应用一、外显子组测序技术简介外显子组序列仅占全基因组序列的1%左右,与人类85%致病基因突变相关。与全基因组测序相比,外显子组测序不仅费用较低,而且测序覆盖度更深,数据准确性更高。外显子测序是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后,再进行高通量测序的基因组分析方法。二、外显子组测序流程三、外显子组测序信息分析流程主要信息分析内容归类3.1、数据过滤与评估3.2、整体质量评估3.3、SNP检测与注释3.4、InDel检测与注释3.5、高级分析3.1、数据过滤与评估

2、过滤接头。对含接头的reads去除接头序列。一条reads上N(未能确定出具体的碱基类型)的比例大于5%,则过滤掉该reads。过滤低质量reads,过滤掉Q30<85%reads。3.1.1、原始数据过滤3.1.2、测序数据统计与评估测序质量值分布图碱基含量分布图3.2、整体测序质量评估3.2.1、测序深度统计注:横坐标代表测序深度,纵坐标代表目标区域上对应深度的碱基数占总碱基数的百分比。目标区域的单碱基分布近似服从泊松分布。3.2.2、外显子捕获统计TargetregionstatX1X2X3X4Le

3、ngth_of_target_region(Mb)1118.70118.70118.70118.70Reads_mapping_ref(singlereads)2182.95168.4897.7696.16Mapping_datasize(Mb)3137211263697769616Effective_sequences_on_target(Mb)592.0590.8666.8464.37Average_sequencing_depth_on_target747.3146.7543.0541.45Mism

4、atch_rate_in_target_region8Mismatch_rate_in_all_effective_sequence9Base_covered_on_target(Mb)106904681566846437Coverage_of_target_region11Fraction_of_target_covered_with_at_least_20x12Fraction_of_target_covered_with_at_least_10x13Fraction_of_target_covere

5、d_with_at_least_4x14当比对到参考基因组目标区域的数据量在60%之上,认为外显子捕获效率合格。3.2.3、染色体覆盖深度分布注:横坐标为染色体长度,纵坐标为覆盖深度取对数。3.3、SNP检测及注释3.3.1、SNP检测SNP的检测主要使用GATK软件工具包实现。BMKIDSNPNumberTransitionNumberTransversionNumberTi/TvRatioHeterozygosityNumberHomozygosityNumberX198525466917231608

6、22.11207400777854X28425165733992691172.13167179675337X3263326178220851062.0926436236890X4289954196145938092.0930446259508Total1556901TypeR01R02R03R04INTERGENIC449352380794113110125682INTRAGENIC34252896892975INTRON401739343966111218121865UPSTREAM2445221350

7、61056521DOWNSTREAM95551835652773230377UTR_3_PRIME395407112124UTR_5_PRIME21651891776850SPLICE_SITE_ACCEPTOR31361414SPLICE_SITE_DONOR61541921CDSNON_SYNONYMOUS_CODING19711899882925NON_SYNONYMOUS_START2100START_GAINED37834693100START_LOST8632STOP_GAINED262410

8、8STOP_LOST5310SYNONYMOUS_CODING17721732923940SYNONYMOUS_STOP1100Other1068932183.3.2、SNP注释3.3.3、突变特征突变频谱图注:横坐标为不同类型的突变,纵坐标为不同类型突变对应的频率。3.3.3、突变特征突变位点上下文碱基偏好性注:横坐标为突变位点上下文的碱基位置,0为SNP突变位点,负数代表突变位点前的碱基,正数代表突变位点后的碱基,纵坐标为

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。