技术嘉年华ppt推荐系统简介ppt课件.ppt

技术嘉年华ppt推荐系统简介ppt课件.ppt

ID:59270494

大小:2.40 MB

页数:36页

时间:2020-09-22

技术嘉年华ppt推荐系统简介ppt课件.ppt_第1页
技术嘉年华ppt推荐系统简介ppt课件.ppt_第2页
技术嘉年华ppt推荐系统简介ppt课件.ppt_第3页
技术嘉年华ppt推荐系统简介ppt课件.ppt_第4页
技术嘉年华ppt推荐系统简介ppt课件.ppt_第5页
资源描述:

《技术嘉年华ppt推荐系统简介ppt课件.ppt》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、主要内容推荐系统概念淘宝的数据亚特兰蒂斯-淘宝推荐系统介绍推荐系统定义维基百科:formorworkfromaspecifictypeofinformationfilteringsystemtechniquethatattemptstorecommendinformationitems(item,music,books,news,imagesetc.)orsocialelements(e.g.people,eventsorgroups)thatarelikelytobeofinteresttotheuse

2、r.找到用户可能会感兴趣的物品,然后以一定的形式推荐给用户。1)如何找到用户感兴趣的东西2)以什么形式告诉用户推荐系统作用提高用户忠诚度提高成交转化率提高网站交叉销售能力推荐系统的核心产品核心系统算法推荐系统产品形式相关商品、店铺、达人推荐评论、资讯推荐邮件营销群体信息披露趋势引导热门推荐etc推荐系统系统组成数据算法(离线计算和在线计算)MessagingsystemSearchengineNoSQL分布式计算效果评测数据explicit(显式):能准确的反应用户对物品的真实喜好,但需要用户付出额外的代

3、价用户收藏用户评价愿望清单Implicit(隐式):通过一些分析和处理,才能反映用户的喜好,只是数据不是很精确,有些行为的分析存在较大的噪音用户浏览用户页面停留时间、访问次数购物列表算法算法计算方式离线:用户类目偏好、用户购买力分析、关联性分析在线:排序、过滤、增量计算算法多样性同一个场景多种算法组成Messagingsystem大型系统不可或缺的重要组成部分与其他系统解耦,消息转发Searchengine文本分析抽取关键词作为推荐系统的一个信息检索技术,全文检索内容相关性匹配NoSQL分布式计算大规模数

4、据统计和运算大数据集合的ETLMapReduce,Hadoop、Hive效果评测推荐系统的效果需要数据来评测Offline:给定输入输出,验证系统的输出Online:ABtest衡量指标CTRGMVPVUV推荐系统主要算法content-basedcollaborative-basedAssociationRulescontent-basedbuildatermvectorandthenassociatesimilaritemsbasedonthesimilaritiesbetweentermvector

5、s.TF/IDF:TermFrequency/InverseDocumentFrequencyTF-IDF(t,d)=TF(t,d)*IDF(t)Document={term1,term2,……,termN}DocumentVector={weight1,weight2,……,weightN}content-based优点:简单,搜索引擎支持缺点:难以区分商品信息的品质,而且不能为用户发现新的感兴趣的商品,只能发现和用户已有兴趣相似的商品collaborative-basedamethodofmaking

6、automaticpredictions(filtering)abouttheinterestsofauserbycollectingpreferencesortasteinformationfrommanyusers(collaborating)Memory-Basedusesuserratingdatatocomputesimilaritybetweenusersoritems.User-Based(People-to-PeopleCorrelation):推荐系统根据客户与其他已经购买了商品的客户之

7、间的相关性进行推荐Item-Based(Item-to-ItemCorrelation):推荐系统根据客户感兴趣的产品推荐相关的产品Model-Based:usesdatamining,machinelearningalgorithmstofindpatternsbasedontrainingdata.BayesianNetworks,clusteringmodels,latentsemanticmodelsetccollaborative-based优点:保证推荐的商品质量缺点:coldstart、sp

8、arsity、firstraterAssociationRulesamethodfordiscoveringinterestingrelationsbetweenvariablesinlargedatabases支持度置信度Apriori算法淘宝数据特点数据量巨大几百万店铺上亿激活用户上亿的在线商品几十亿的收藏信息商品问题同一类商品多个卖家标类非标类类目属性正确性恶意收藏刷信誉商品体系商品基本信息类目体系SPUSKU(Stoc

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。