基于内容的推荐算法

基于内容的推荐算法是信息过滤与信息检索技术在个性化信息服务领域的延续与发展,该方法主要侧重于项目的内容分析,提取项目的主要属性特征,并通过计算与用户偏好的相似性来进行匹配,找出待推荐用户可能感兴趣的项目进行推荐。例如,在电影推荐系统系统中,推荐系统分析用户以前选择的电影的共性,找到用户的兴趣点。然后从其他电影中选择和用户兴趣点相似的电影推荐给用户。

相似度的量化方法有很多,如余弦相似度、皮尔逊相关度等。计算所得的相似度值,按其大小排序,将最靠前的若干个对象作为推荐结果呈现给用户。

基于内容的推荐策略中的关键是用户模型描述和推荐对象内容的特征抽取。对于对推荐对象内容进行特征提取,目前对文本内容进行特征提取方法比较成熟,如使用TF-IDF来表示文木文档或网页文档的特征。

基于内容的推荐有如下优点:

  1. 简单、有效,推界结果直观,容易理解,不需要领域知识。
  2. 不需要用户的历史数据,如对项目的评分评价等。
  3. 没有新推荐对象出现的冷启动问题
  4. 没有稀疏问题
  5. 比较成熟的分类学习方法能够为该方法提供支持

但也有如下缺点:

  1. 很难出现新的推荐结果。推荐对象的内容特征和用户的兴趣偏好匹配才能获得推荐,用户将仅限于获得跟以前类似的推荐结果,很难为用户发现新的感兴趣的信息。
  2. 存在新用户出现时的冷启动问题。当新用户出现时,系统较难获得该用户的兴趣偏好,就不能和推荐对象的内容特征进行匹配,该用户将较难获得满意的推荐结果。
  3. 对推荐对象内容分类方法需要的数据量较大。目前,尽管分类方法很多,但构造分类器时需要的数据量巨大,给分类带来一定困难
  4. 不同语言描述的用户模型和推荐对象模型之间无法实现完全兼容。

results matching ""

    No results matching ""