1 阿里移动推荐算法 SecRet;WeaPon.pdf

1 阿里移动推荐算法 SecRet;WeaPon.pdf

ID:48024582

大小:2.82 MB

页数:40页

时间:2020-01-26

1 阿里移动推荐算法 SecRet;WeaPon.pdf_第1页
1 阿里移动推荐算法 SecRet;WeaPon.pdf_第2页
1 阿里移动推荐算法 SecRet;WeaPon.pdf_第3页
1 阿里移动推荐算法 SecRet;WeaPon.pdf_第4页
1 阿里移动推荐算法 SecRet;WeaPon.pdf_第5页
资源描述:

《1 阿里移动推荐算法 SecRet;WeaPon.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、阿里移动推荐算法大赛答辩SecRet;WeaPon孝陵卫南京理工大学数据挖掘探险队Nothing中兴图灵杯人工智能一等奖标签推荐数据挖掘方向特征工程FurongImplus数学建模一等奖数据挖掘推荐系统方向南理校ACM队员,银奖第一框架设计中兴图灵杯人工智能一等奖DeepLearning方向算法及融合模型后续算法及任务描述模型融合特征工程框架设计任务描述移动推荐任务31天0~30天脱敏用户商品交互数据用户购买商品?0~30天交互数据重点用户4种操作:点击浏览、收藏、加入购物车、购买商品的类别归属等后续算法及任务描述模型融合特征工程框架设计框

2、架设计二分类0~30天用户商品交互数据31天用户购买商品?考察日用户A在考察日四元素购买了商品x用户用户商品商品全集用户B在考察日考察日未购买商品y是否购买框架设计样本结构四元素用户商品考察日是否购买发生购买行为则为1未发生购买行为则为0框架设计样本选择方案一:所有用户×所有商品方案二:考察日前所有有交互的用户×交互商品方案三:考察日前特定天数特定交互的用户×交互商品框架方案一:所有用户×所有商品设计用户数商品数观察天数总样本数5million13million32总样本约:2000000000000000个用我们的特征体系计算所有样本的时

3、间是:273972年未交互样本量巨大且缺乏大量有效信息,考虑过滤。框架方案二:考察日前所有有交互的用户×交互商品设计购买转化率18.00%16.00%14.00%12.00%10.00%BrowseCollection8.00%Add-to-cart6.00%4.00%2.00%0.00%ddate=1ddate=2ddate=3ddate=4ddate=5ddate=6ddate=7ddate=8ddate=9ddate=10框架方案二:考察日前所有有交互的用户×交互商品设计前n天交互对象为考察日正样本分布(平缓)1800000•7天正样

4、本~=10+天正样本16000001400000120000010000008000006000004000002000000前n天交互对象为考察日负样本分布BrowseCollectionAdd-to-cart2.5E+092E+091.5E+091E+09▪浏览负样本陡增,500000000每往前推一天,0+2亿负样本BrowseCollectionAdd-to-cartDay1Day1-2Day1-3Day1-4Day1-5Day1-6Day1-7Day1-8Day1-9Day1-10框架方案三:考察日前特定天数特定交互的用户×交互商

5、品设计转化率样本量模型性能效率框架设计样本分配-训练测试067293031线下模型训练线上模型一训练线上模型二训练后续算法及任务描述模型融合特征工程框架设计特征工程特征创新引入丰富的特征群(即按照特征属性分为10类)精心设计了大量二次组合统计特征特征工程特征群-基础群U(用户)Geo(地理信息)IC(商品)(商品类别)特征工程特征群-基础群U特征群I特征群C特征群Geo群计数特征计数特征计数特征用户商品最加和特征加和特征近距离特征加和特征商品热度特征加权特征交互时间特征类别热度特征商品是否具转化率特征交互人数特征有地理信息活跃度特征回头客特

6、征特征星期分布特征特征工程特征群-衍生群UIUI用户商品用户-商品U特征I特征C特征U特征-UI特征群UC特征群I特征UI特征群-IC特征群C特征UC特征群IC特征群-特征工程特征群-衍生群UI特征群UC特征群IC特征群计数特征计数特征加和特征比例特征加和特征权值特征权值特征交互时间特征交互时间特征习惯偏差特征排序特征习惯偏差特征星期分布特征特征工程同理-衍生群UI&UC特征群U&UI特征群U&UC特征群基本比率特征基本比率特征竞争特征二次购买特征二次购买特征竞争特征交互时间比特征交互时间比特征排名特征交互排名特征交互排名特征特征工程二次统

7、计特征特征群特征名特征含义优势及作用UI&UCuiuc_row_ln_weight该用户在考察日前7天对该商品4种防止预测一个_day_1_7操作加权值在用户对该类下所有商用户购买同类品加权值中的排序商品下的大量不同物品U&UIuiu_row_ln_weight_d该用户在考察日前7天对该商品4种可以预测出用ay_1_7操作加权值在用户对所有商品加权户最想购买的值中的排序商品U&UCucu_row_ln_weight_d该用户在考察日前7天对该类别商可以预测出用ay_1_7品4种操作加权值在用户对所有类户最想购买的别加权值中的排序类别*4种

8、操作加权值是指对4种操作数目加权统一成一个数值特征工程特征细节–总维度有2064,核心维度有780+–统计特征窗口为1/2/3/4/5/6/7/10/15/21/30–ln(1+

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。