互联网培训材料

互联网培训材料

ID:39058170

大小:1.54 MB

页数:8页

时间:2019-06-24

互联网培训材料_第1页
互联网培训材料_第2页
互联网培训材料_第3页
互联网培训材料_第4页
互联网培训材料_第5页
资源描述:

《互联网培训材料》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、*ZZNODEBD2直真数据网管产品功能架构互联网内容资源管理系统培训材料2015-3*0.目录1.到处是爬虫资源结构、广度优化3.资源引入建议去重、可缓存5.移动互联网分析APP、手机浏览器2.资源分布资源分布、可缓存判断4.缓存黑白名单、命中率*1.到处是爬虫页面结构网内(省内+省外)/总服务流量爬虫原理分析页面超链接广度优先,深度一般为5层多网站并行爬取也不能爬太快很多爬虫Google,Baidu一个月建立一个索引Sina门户有上亿的资源1.javascript2.css3.图片4.超链接页面结构*2.资源分布资源分布判断省内资源的归属情况,省

2、内、外省、电信、联通、铁通、其它可缓存判断对资源进行是否可缓存的判断结合用户的缓存经验库判断算法资源:httpheader中的三个字段域名:只有一个资源可缓存网站库*3.资源引入建议去重IDC、CDN、CACHE协同去重自建、租用CACHE去重分析出重复的资源引入(部分省份不开展,主要原因去重工作的影响面)引入建议资源引入建议资源引入优化建议*4.再说说缓存缓存分类P2P、HTTP(小文件、大文件、动态)缓存厂家(辽宁)华为(全线产品)网宿(P2P,HTTP小文件、手机加速、动态协议)不断成长的可缓存判断算法自动算法+经验库(用户根据本省实际情况适配

3、)目前只使用静态配置的黑名单、白名单*5.移动互联网分析基于手机抓包单APP、定制场景分析基于Gn口DPI数据量大、用户行为分析THANKSATON

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。