论文部分内容阅读
在社会科学和自然科学相关研究领域中,大量的决策问题都离不开预测,小至个人生活,大至整个国家,都可能需要对一些方案的可行性及优劣性做出预测判定,从而选择最优的行为。而预测作为决策的基础,对方案的选择起着相当重要的作用。同时,有关事物的信息往往也是不完整的,相关的理论也不是万能和完善的,人们对已有事物的了解也仅限于观测数据,即时间序列数据(简称“时序数据”),进而只能利用现有的历史数据建立相关模型,进而预测未来。IPTV(Internet Protocol Television)作为一种新兴的产业,正以高速的发展速度影响和改变着人们的生活方式。据权威机构的预测,到2012年中国的IPTV用户将达到1620万,并将进入一个爆炸式的发展阶段。伴随着IPTV用户群体的日益壮大,其平台也逐渐累积了大量宝贵的节目时间序列数据。这些数据背后都蕴藏着对IPTV节目,甚至其发展决策有重要参考价值的信息,同时结合导师“某公司IPTV平台用户行为分析”的研究课题,本文进行了时序数据挖掘技术在IPTV节目热度预测中的应用研究。首先,文章分析了国内外相关时间序列预测的方法及其适用范围。然后,以IPTV领域中存在的节目收视时序数据为实际应用背景,结合IPTV节目自身的数据特点和应用需求,提出了适合IPTV节目相关特点的节目热度挖掘模型。其预测模型主要依据节目热度的发展经历的过程,即节目发展通常会经历前期和后期过程,于此分别对节目发展相关过程进行分析,从而最终实现对节目热度的预测。另一方面,鉴于IPTV节目收视数据的特殊结构,即用户-项目-时间三维结构,为此本文将其映射为三个两维的关系:用户-项目关系、用户-时间关系、项目-时间关系,然后通过对不同两维关系的分析,从而实现对节目相关过程的预测。最后,本文通过相关实验来验证了文章中提出的相关模型和算法的有效性,同时也为IPTV运营商提供节目热度预测及决策做出了有益的探索。