五对混合推荐系统的思考( 三 )


1
单体的()混合范式
单体的混合范式整合多种推荐算法到同一个算法体系中,由这个整合的推荐算法统一提供推荐服务,具体的实现流程参考下面的图1 。

五对混合推荐系统的思考

文章插图
图1:单体的混合推荐范式
基于内容的推荐算法如果利用用户行为数据来计算标的物相似性属于这类算法 。单体范式的混合推荐算法主要有如下两种具体实现方案:
(1) 特征组合( )混合
特征组合利用多个推荐算法的特征数据来作为原始输入,利用其中一个算法作为主算法最终生成推荐结果 。
拿协同过滤和基于内容的推荐来说,可以利用协同过滤算法为每个样本赋予一个特征,然后基于内容的推荐利用这些特征及内容相关特征来构建基于内容的推荐算法 。比如可以基于矩阵分解获得每个标的物的特征向量,基于内容的推荐利用标的物之间的计算相似度,同时也整合前面基于矩阵分解获得的特征向量之间的相似性 。
协同过滤与基于内容的推荐进行特征组合混合能够让推荐系统利用协同数据,而不必完全依赖它,因此降低了系统对某个标的物有操作行为的用户数量的敏感度,也就是说,即使某个标的物没有太多用户行为,也可以很好地将该标的物推荐出去 。
【五对混合推荐系统的思考】由于特征组合方法非常简单,将协同过滤和基于内容的推荐进行组合是非常常用的方案 。
(2) 特征增强( )混合
特征增强混合是另一个单体混合算法,不同于特征组合简单地结合或者预处理不同的数据输入,特征增强会利用更加复杂的处理和变换,第一个算法可能事先预处理第二个算法依赖的数据,生成中间可用的特征或者数据(中间态),再供第二个算法使用最终生成推荐结果 。
比如我们公司在做视频相似推荐时,先用进行视频嵌入学习(参考作者另一篇文章《嵌入方法在推荐系统中的应用》(点击蓝色字体阅读文章)第四节2中的介绍),学习视频的表示向量,最后用聚类来对视频聚类,最终对每个视频,将该视频所在类的其他视频作为该视频的关联推荐,这也算是一种特征增强的混合推荐算法 。
2
并行的()混合范式
并行的混合范式利用多个独立的推荐算法,每个推荐算法产生各自的推荐结果,在混合阶段将这些推荐结果融合起来,生成最终的推荐结果,具体实现逻辑参考下面的图2 。
五对混合推荐系统的思考

文章插图
图2:并行的混合推荐范式
并行混合范式利用多个推荐算法密切配合,利用特殊的混合机制聚合各个算法的结果,根据混合方案的不同主要有如下3中具体的实现方式 。
(3) 掺杂(Mixed)混合
掺杂方法将多个推荐算法的结果混合起来,最终推荐给某个用户,见下面公式,其中,k是第k个推荐算法 。
上面公式只是给出了为用户推荐的标的物列表,不同的算法可能会推荐一样的,需要去重,另外这些标的物需要先排序再最终展示给用户,一般不同算法的排序逻辑不一样,直接按照不同算法的得分进行粗暴排序往往存在问题 。可以将不同的算法预测的得分统一到可比较的范围(比如可以先将每个算法的得分归一化到0-1之间),再根据归一化后的得分大小来排序 。还可以通过另外一个算法来单独进行排序 。
(4) 加权()混合
加权方法利用多个推荐算法的推荐结果,通过加权来获得每个推荐候选标的物的加权得分,最终来排序 。具体某个用户u对标的物i的加权得分计算如下: