论文阅读---推荐、广告、增长( 二 )

(b)边是购买/浏览/加购顺序 , 边上的权重是频次 。
消除噪声:
1、如果单击后的停留时间少于一秒钟 , 则单击可能是无意的 , 需要删除 。
2、有些“过度活跃(羊毛党)”的用户实际上是垃圾邮件用户 。根据长期观察 , 如果一个用户在不到三个月的时间内购买了1000件商品或者他/她的点击总数超过3500次 , 那么这个用户很可能是一个垃圾邮件用户 。我们需要过滤掉这些用户的行为 。
3、零售商不断更新商品的细节 。在极端情况下 , 一个商品在经过长时间的更新后 , 可能会成为同一个标识符的完全不同的商品 。因此 , 我们删除与标识符相关的项 。
与相比的特色:为了解决冷启动问题 , 使用冷启动项目附带的Side 来增强BGE 。在电子商务的RS场景中 , 边信息是指一个商品的类别、商店、价格等 , 在排名阶段被广泛用作关键特征 , 但在匹配阶段很少被应用 。在图形嵌入中加入侧信息可以缓解冷启动问题 。例如 , 优衣库(同一家店)的两个连帽衫(同一类别)可能看起来很相似 , 喜欢尼康镜头的人也可能对佳能相机(类似类别和类似品牌)感兴趣 。这意味着具有相似边信息的项应该更靠近嵌入空间 。
label分类模型 Deepfor Image 何凯明 ltv 《UserfromandData toValue》
ltv的挑战:用户的消费行为数据不稳定、噪声、数据稀疏 。
为了解决这些问题 , 本文提出 , 利用用户收入时间序列、用户属性去学习 anduser。通过小波变化去学习 ,  rep- 通过Graph(GAT)来学习 。
传统的ltv分两类:基于概率的生成方法和基于机器学习的方法 。前者主要是预测复购和用户流失 , 但这种方法依赖先验分布 。还有一种角度是把ltv看作一种特殊的时间序列预测任务 。
Model 《2020-forwith Cost 》 召回 《 Tree-based Deep Model for》 TDM 阿里妈妈 2018