论文部分内容阅读
以往的电视用户画像方法是先从电子节目表单系统获取节目标签,然后分析电视节目和用户之间的关系,进一步得到用户的画像标签,因为EPG的标签具有强烈的主观性,所以最后得到的标签覆盖面相对较窄。本文从电视用户收视数据清洗、微博爬虫实现、微博数据清洗三方面分析收视数据和微博数据处理,进一步研究电视用户画像,以供参考。