分类: 推荐系统百问百答

推荐系统百问百答 | 性能与评估

推荐系统的性能 模型的实时性是如何影响推荐系统的效果的? 模型更新的间隔时间越长,推荐系统的效果越差;反过来说,模型更新得越频繁,实时性越好,损失越小,效果越好。 从用户体验的角度讲,在用户使用个性化新闻应用时,用户的期望是更快地找到与自己兴趣相符的文章;在使用短视频服务时,期望更快地”刷到“自己感兴趣的内容;在线购物时,也期望更快地找到自己喜欢的商品。只要推荐系统能感知用户反馈、实时满足用

推荐系统百问百答 | 冷启动与EE

冷启动 当新用户注册或新物品入库的时候,该怎么给用户提供满意的推荐服务,以及怎么将新物品推荐出去,推荐给喜欢他的用户? 基于规则的冷启动 在冷启动过程中,由于数据缺乏,个性化推荐引擎无法有效工作,可让系统采用基于规则的推荐方法。 在用户冷启动场景下,可使用”热门排行榜“,”最近流行趋势“、”最高评分“等榜单作为默认的推荐列表。此外,可以参考专家意见建立一些个性化物品列表,根据用户的有限信

推荐系统百问百答 | 特征工程篇

特征工程 让你设计一个推荐系统的特征工程,你会怎么去设计?包括用户侧、物品侧和上下文特征。 用户侧: 人口统计学特征:比如性别、年龄、地理位置等 用户行为特征:用户的潜在兴趣,用户对物品的真实评价均包含在用户的历史行为中,一般分为显式反馈行为和隐式反馈行为,对不同的业务场景,分别有不同的体现: 业务场景 显式反馈 隐式反馈 电子商务 对商品的评分 点击、加入购物车、

推荐系统百问百答 | 召回篇

召回 假设物品库数量达到百万级别,如何设计方法从这个数量级别的物品中推荐给用户top10的物品,同时可以减少计算的压力? 在推荐系统的排序层,一般会使用复杂模型,利用多特征进行精准排序,而如果直接对百万量级的候选集进行逐一推断的话,则计算资源和延迟都是在线服务过程无法忍受的。 因此可以加入召回过程,利用少量的特征和简单的模型或规则进行候选集的快速筛选,减少精准排序阶段的时间开销。 推荐系统

推荐系统百问百答 | Embedding篇

Embeddng Embedding技术为何对深度学习推荐系统来说非常重要? 1)推荐场景中大量使用one-hot编码对类别、id型特征进行编码,导致样本特征向量极度稀疏,而深度学习的结构特点使其不利于稀疏特征向量的处理,因此几乎所有深度学习推荐模型都会由Embedding层负责将高维稀疏特征转换为低维稠密特征向量。因此,各类Embedding技术是构建深度学习推荐模型的基础性操作。 2)E

推荐系统百问百答 | 深度模型篇

Deep Crossing 请简述Deep Crossing的网络结构。 Deep Crossing的网络结构图示如下: 其主要包括四层: 1)Embedding层:将经过one-hot之后的稀疏的类别型特征向量转换成低维稠密的Embedding向量;而数值型特征无需经过Embedding层,直接进入下一层。 2)Stacking层:将不同的Embedding特征和数值型特征拼接在一起,形

推荐系统百问百答 | 浅层模型篇

协同过滤 请简述基于用户的协同过滤UserCF的推荐过程。 UserCF(User Collaboration Filter),即基于用户的协同过滤算法。其中协同过滤的含义是不同的用户通过与item的互动比如点赞、收藏等,使自己的推荐列表过滤掉自己不感兴趣的物品,从而得到最终的推荐结果。 以电商网站为例,他的步骤一般分为: 1)构成用户交互行为共现矩阵 假如用户对商品有浏览、收藏、加入购物车