淘宝从空间预测到个性化推荐

个性化推荐相信大家都不会陌生,当前已经深入到了我们很多的业务场景,基本上谈到电子商务和网上购物,第一个想到的挖掘场景就是个性化推荐 。
常用的推荐算法大致分为3类:
1.关联规则
2. ITEM-BASED算法
3. USER-BASED算法
这3种方法都是比较传统的推荐算法 。在应用上来看纯粹的关联规则算法在推荐领域已经用的比较少了,而ITEM-BASE的应用是最为广泛的,亚马逊和阿里的推荐算法绝大部分都是围绕着ITME-BASE展开的,这种方法推荐结果的可解释性最强 。例如当你买过一本理论力学的书后,系统给你推荐一本材料力学,你总是可以理解的 。
所谓啤酒和尿布的这种例子在真实的场景中出现的是很少的,甚至会给客户带来一定疑惑 。而USER-BASED则在影视推荐中用的比较多,例如豆瓣 。买东西和看电影的动机还是有很大不同的,在电影推荐中强调一定的实效性和热门性,通过USER-BASED的算法可以把近期的关注热点有效的推荐出来 。所以总结来说ITEM-BASED更适用于电子商务平台,而USER-BASED更适用于基于的社会化站点(包括音乐,电影和图书分享,例如豆瓣,Mtime等) 。
那么空间预测又是什么,简单来说就是预测你在某一时刻可能出现的地点 。
例如需要预测某位技术宅朋友上午10点、中午12点、下午3点、晚上8点分别在什么地方 。
那么接下我们想想这个问题该如何解决:
1.如果是一般的工作日,那么问题相对简单,基本上上午10点会在公司上班,中午12点在食堂、下午3点又回到公司,晚上8点可以根据该同学的作息习惯预测他是仍然在公司加班还是已经回到家中 。
2.如果是双休日,问题稍微复杂了一点,当然也还是有迹可循,如果我们能采集到该同学历史上在双休日的作息行为,仍然可以给出有效的预测 。
3.今天该同学去北京旅游了,那么他会出现在哪?这个问题就有点头大了,前面两种情况的思路完全不适用,北京对于这位同学来说可能以前只是偶尔去过,或是根本没去过,我们没有办法根据历史数据做出有效的预测,那么该怎么办 。好吧,我想我应该去问问其他去北京旅游过的同学,问问他们的行程,或是查阅一下北京的热门景点,来得到一些启发 。于是我们可以整理出故宫、长城、鸟巢、水立方等著名景点,接下来可以进一步根据该同学的性格偏好来猜测他可能会去的地方 。
看起来空间预测和个性化推荐没什么必然联系,但最近有一些研究学者已经在用一些空间预测的思路来完善推荐算法,进而产生了一种新的学派——基于意图的推荐 。
我们再来分析一下两者之间的潜在联系 。曾经有个女生问我,我要买一件衣服,买什么好?我说“你完全可以根据自己的喜好来买,这个问题根本不应该问我..”,然后她又问,我想送男朋友一个手机,送什么好?我知道她平时对手机没什么研究,于是我说“这个更简单,首先你想买什么价位的,然后去看看这个价位中的热卖手机就好了”,是不是感觉和空间预测有点类似了呢?
我们可以把商品的类目想象成地理位置,服装对于这个女生来说就是她经常去的很熟悉的地方,而手机则是她比较陌生偶尔去‘旅游’的一个地方,当她处于服装这个类目时,系统应该根据她的偏好来做推荐,而当她处于手机这个类目时系统则应该通过分析热销商品来给出推荐结果 。当我们把客户的空间位置引入到推荐系统当中,并且根据客户在不同时刻所处位置的不同来调用不同的推荐算法可能会使我们的推荐精度提高很多,同时给传统的推荐引擎打开了另一扇大门——组合推荐系统 。