论文部分内容阅读
大数据分析技术成为热点问题,而其中的核心问题之一便是大数据预测。各类在线媒体数据包含了海量的话题信息,针对这些话题数据,本文提出了可以结合语义相似度和时间序列的一种新颖的在线数据预测方法,通过数据分析技术,寻找话题在将来发展趋势、相关性和其他有用的信息。该方法主要基于最邻近查询技术,预测的主要依据是相似的话题会表现出相似的行为。最后针对大量数据的实验结果证明了TSM算法在预测范围14天内的预测差错率在11%~23%。