推荐系统百问百答 | 冷启动与EE

冷启动

当新用户注册或新物品入库的时候,该怎么给用户提供满意的推荐服务,以及怎么将新物品推荐出去,推荐给喜欢他的用户?

  • 基于规则的冷启动

在冷启动过程中,由于数据缺乏,个性化推荐引擎无法有效工作,可让系统采用基于规则的推荐方法。

在用户冷启动场景下,可使用”热门排行榜“,”最近流行趋势“、”最高评分“等榜单作为默认的推荐列表。此外,可以参考专家意见建立一些个性化物品列表,根据用户的有限信息,如注册时填写的年龄、性别、地址等信息做粗粒度的规则推荐。

在物品冷启动场景下,可根据一些规则找到该物品的相似物品,利用相似物品的推荐逻辑完成物品的冷启动。

但基于规则的冷启动与推荐系统是割裂的,可通过丰富冷启动过程中可获得的用户与物品特征,如下:

  • 改进推荐模型的冷启动

在历史数据特征缺失的情况下,推荐系统仍然可以凭借用户和物品的属性特征完成较粗粒度的推荐。这类属性特征主要包括:

1)用户注册信息:包括人口属性信息(年龄、性别、学历、职业等)和通过IP地址、GPS信息等推断出的地理信息。

2)第三方DMP:第三方数据管理平台不仅可以提供基本的人口属性特征,通过大量应用、网站的数据交换,甚至可以提供脱敏的用户兴趣、收入水平、广告倾向等一系列的高阶特征。

3)物品的内容特征:在推荐系统中加入物品的内容相关特征是有效解决”物品冷启动“的方法。物品的内容特征可以包括物品的分类、标签、描述文字等。

4)引导用户输入的冷启动特征:有些应用会在用户第一次登陆时引导用户输入一些冷启动特征,如选择电影标签、音乐标签等。

探索与利用

简述探索与利用的含义。

Greedy算法的原理是什么?有什么缺陷?

请简述Thompson Sampling方法的原理和步骤。

请问UCB方法是如何解决冷启动中的探索和利用问题的?

简述LinUCB的原理与具体的做法。

分享到