浅谈个性化推荐系统的算法

2017-05-30潘钰明志

科技尚品 2017年2期

关键词：物品个性化协同

潘钰明志

摘要：个性化推荐在中国的高速发展，大家有目共睹。虽然许多推荐结果可能不尽如人意，还达不到很多人期待的结果。但个性化推荐相信每一个人都是有他独特的价值。尊重每一个活生生的个体，而不是二八法则中那冷冰冰的数字。

关键词：个性化推荐；协同过滤

1 个性化推荐系统的兴起

1.1 商业动力

在传统的营销策略当中，商家主要关注在20%的商品上创造80%收益的客户群，往往会忽略了那些在80%的商品上创造20%收益的客户群。这就是典型的二八法则的应用，而长尾理论的提出，直接打破了传统的二八法则，这是网络时代兴起的一种新理论，最初由美国《连线》杂志（Wired）总编辑克里斯·安德森于04年首先发表。由于成本和效率的因素，当商品储存流通展示的场地和渠道足够宽广，商品生产成本急剧下降以至于个人都可以进行生产，并且商品的销售成本急剧降低时，几乎任何以前看似需求极低的产品，只要有卖，都会有人买。

1.2 web2.0时代的用户需求

对用户而言——如何快速获取自己想要的信息是互联网用户的主要需求之一，在用户对自己需求相对明确的时候，用搜索引擎能很方便的通过关键字搜索找到自己需要的信息。但在很多情况下，用户其实并不明确自己的需要，或者他们的需求很难用简单的关键字来表述。又或者他们需要更加符合他们个人口味和喜好的结果，因此出现了推荐系统。

1.3 技术条件

推荐系统应该是目前互联网世界最常见的一种智能产品形式。它的技术基础直接源于一系列的人工智能学科的成果。虽然五十多年来，人工智能学科并没能实现人工智能的目标，但一系列成果仍然是值得称道的。举个简单的例子，其中一个分支从规则方法的思路上摆脱出来，寻求利用群体智能，其中一个方向是基于统计规律的思路，而推荐系统中最古老的一个算法：协同过滤算法，正好是这么个思路下的产物。

协同过滤算法是推荐系统中应用最为广泛的基础性算法。基于用户的协同过滤算法推荐更社会化，基于物品的协同过滤算法则更加个性化，能提供更好的推荐解释。

2 个性化推荐系统的算法

2.1 实现原理

随着推荐引擎的出现，用户获取信息的方式从简单的目标明确的数据的搜索转换到更高级更符合人们使用习惯的信息发现。目前大部分电子商务和社交网站的推荐引擎的工作原理还是基于物品或者用户的相似集进行推荐。在海量物品和用户的系统中，推荐引擎的计算量是相当大的，要实现实时的推荐务必需要建立一个推荐模型。主流模型是基于协同过滤的推荐机制。它的原理就是根据用户对物品或者信息的偏好，发现物品或者内容本身的相关性，或者是发现用户的相关性，然后再基于这些关联性进行推荐。基于协同过滤的推荐可以分为3个子类：基于用户的推荐，基于项目的推荐和基于模型的推荐。基于用户的协同过滤推荐的基本原理是，根据所有用户对物品或者信息的偏好，发现与当前用户口味和偏好相似的“邻居”用户群，在一般的应用中是采用计算“K-邻居”的算法；然后，基于这K个邻居的历史偏好信息，为当前用户进行推荐。

2.2 协同过滤

2.2.1 基于用户的协同过滤

协同过滤是一种个性化的推荐算法，这种推荐算法在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的，基于内容分析过滤的推荐不同，协同过滤分析的是用户之间的区别与联系。举个例子：

基于内容分析的推荐：

甲喜欢歌曲A、B、C，通过分析得知A、B、C都是轻快的轻音乐，那么系统将推荐具有类似特征的轻音乐D给甲。

基于协同过滤的推荐：

甲喜欢歌曲A、B、C，乙喜欢歌曲A、B、C、D，那么甲和乙就有很大的相似性，系统将把乙喜欢的歌曲D推荐给甲。

总的来说，协同过滤分析大量用户的兴趣，在用户群中找到与用户甲有相似（兴趣）的用户乙、丙、丁等，综合相似用户乙、丙、丁等对某一内容进行评价，预测甲对该内容的喜爱程度，从而决定是否进行推荐。

2.2.2 基于物品的协同过滤

基于项目的协同过滤推荐的基本原理也是类似的，只是说它使用所有用户对物品或者信息的偏好，发现物品和物品之间的相似度，然后根据用户的历史偏好信息，将类似的物品推荐给用户。

假设用户甲喜欢物品A和物品C，用户乙喜欢物品A，物品B和物品C，用户丙喜欢物品A。从这些用户的历史喜好可以分析出物品A和物品C是比較类似的，因为喜欢物品A的人都喜欢物品C，基于这个数据可以推断用户丙很有可能也喜欢物品C，所以系统会将物品C推荐给用户C。

与上面讲的类似，基于物品的协同过滤推荐和基于用户的推荐其实都是基于相似度预测推荐，只是相似度计算的方法不一样。在大部分站点中，物品的个数是远远小于用户的数量的，而且物品的个数和相似度相对比较稳定，同时基于项目的机制比基于用户的实时性更好一些。