论文部分内容阅读
伴随着互联网技术的快速发展,智慧旅游已然成为备受关注的热点,通过网络获取感兴趣的旅游景点正成为人们选择出行目的地的重要方式。处于信息爆炸的时代,如何快速的从互联网中筛选出有价值的参考信息成为一个迫切需要解决的问题。目前,在解决旅游景点推荐系统数据集稀疏以及准确度问题上,传统的协作过滤算法仍然收效甚微。对此本文充分考虑了用户的评论信息对旅游景点推荐准确度的影响,结合情感分析,基于LDA主题模型对景点评论文本表示、用户情感偏好和景点推荐结果生成等方面进行了深入的研究。研究工作涵盖以下三个方面:(1)分析比较了当前数据挖掘以及自然语言处理的相关关键技术及其研究的现状,研究了目前现有的旅游景点推荐系统相关的推荐技术,由此引入在基于主题模型的旅游景点推荐系统中如何根据用户评论文本来构建用户兴趣偏好模型的问题。(2)提出一种在LDA主题模型中融合情感因子的个性化旅游景点推荐方法(TMSA-CF)。在预处理过的游客评论文本数据集上利用Jieba分词工具完成词性的标注,结合句法分析树来完成句法依存关系分析进而提取文本的特征词以及情感词。根据情感词的极性以及副词的程度等级来预测对应的特征词的评分,基于LDA主题模型将特征词归为潜在的主题并根据特征词的评分来预测潜在主题上的评分,结合传统协作过滤方法解决景点的智能推荐问题。(3)通过在真实数据集上的对比实验发现,基于LDA主题模型的协作过滤推荐方法(LDA-CF)明显比传统协作过滤推荐方法(CF)准确率高,而本论文研究的TMSA-CF要比基于LDA-CF的推荐方法有更高的准确率,同时弥补了一些由于数据稀疏带来的缺陷。最后,结合Bootstrap前端框架编程实现了针对海南旅游资源的个性化旅游景点推荐系统,并对系统进行了功能测试。