论文部分内容阅读
随着互联网的发展,互联网信息服务成为信息高速公路的主角。作为互联网信息服务方式之一的网络数据库扮演着越来越重要的角色。
网络数据库内承载了大量的信息,有大量的用户在不同的时间,不同的地点,不同的情况下使用这些信息,每一个用户使用海量信息中的一部分,这种服务是在用户和服务器之间进行的。数据库里的信息需要按照一定的结构进行组织,信息与信息之间的关系有时也会比较复杂。在这种情况下,信息提供商需要了解用户的行为和需求,以改进信息服务的质量,甚至满足个性化需要。但是对如此大量的数据进行梳理和分析确实不是一件容易的事情。所以,很多企业目前大量的信息都寄存在服务器上,无法问津。
本文针对上述问题进行研究和解决。分析了信息内容服务的现状以及发展趋势,指出信息服务提供商应该重视提升服务能力;介绍了数据挖掘以及文本挖掘的概念,数掘挖掘进行海量数据处理的方法和步骤;利用数据挖掘的方法,对《道琼斯财经资讯数据库教育版》的日志文件和文本文件实施了数据挖掘,通过对结果分析,为企业进行商务决策提供有参考价值的建议。以进一步说明如何利用数据挖掘技术,进行海量信息数据库的整理、加工和处理,将记录在服务器上的大量的数据通过数据挖掘工具转化为信息和知识的过程,来说明数据挖掘技术在互联网数据库中的应用。
在将数据挖掘技术应用于信息资讯行业的过程中,特别是实施于道琼斯公司财经资讯数据库的现实应用中,我们发现一方面需要解决好一系列具体技术实施问题,同时,必须建立一套良好的而行之有效的管理体系与方法论才能够将这样的技术优势充分转化为组织价值的一部分。本分阐述了与技术手段结合的管理系统,以使包括数据挖掘技术在内的诸多新兴技术手段在实践应用过程中更加充分发挥其自身价值。