论文部分内容阅读
摘 要:随着经济的不断发展,WEB使用挖掘已经是实现个性化推荐系统的有效途径。通过对网站日志数据进行挖掘发现频繁访问模式,再结合活动用户的访问页面序列来实现个性化的在线推荐。本文将就基于WEB的数据挖掘技术进行相关探讨。
关键词:WEB使用挖掘;在线;网站;应用
0 引言
随着经济和科技的快速发展,互联网技术的应用也越来越广泛,但是由于互联网内容的日益扩增,信息的过载现象越来越明显,信息的迷失对于人们的互联网利用来说有所制约,互联网中广阔的空间和信息如何得到有效和充分的利用,如何对个人兴趣或者需求快速的定位并实现是一个非常重要的问题,WEB数据挖掘是这种大环境下推出的一项综合性技术,主要就是指WEB 从文档结构和使用的集合C 中發现隐含的模式P,如果将C看做是输入,P 看做是输出,那么WEB 挖掘过程就可以看做是从输入到输出的一个映射过程。基于WEB的数据挖掘技术就应运而生。
1 基于WEB的数据挖掘技术的概况
数据的挖掘顾名思义就是从大量的、模糊的、随机的、不确定性的信息数据库中选择有价值的数据信息和知识,这是一个寻找的过程,也是一个决策支持的过程,数据挖掘的实现依赖于人工智能、机器学习、模式学习、统计学等技术。数据挖掘的基本原理就是通过对大量数据的分析进行推理和预测,这种分析是自动化的,大大减轻了人工的负担提高了工作的效率,从分析中对潜在模式和有用信息进行有效的挖掘,对于企业、商家以及各方面的用户来说都具有非常重要的意义,是决策的一个科学基础,很多领域都已经应用到了WEB数据挖掘技术,解决了相当多的相关难题,常用的数据挖掘技术有回归分析、神经网络、聚类等,这些方法能够对数据进行不同角度的全方位挖掘,实现数据的可视化和精确。
WEB在数据的挖掘过程中通常是三个阶段,包括数据的预处理、数据的模式发现、模式的应用分析。
1.1 数据预处理 该服务器的应用并不是针对数据挖掘而设定的,这就需要在WEB使用的过程中首先要进行过滤处理,对于数据的不完整以及模糊、不一致等问题进行一个初步的筛选,从而生成一个新的数据库,这就是数据的预处理工作,预处理的工作对于后续工作来说是一个重要的基础,能够对挖掘算法的产生模式和规则直接影响。
1.2 模式发现 挖掘算法的重要过程之一就是模式发现,这是挖掘算法的实施内容,对于预处理之后的数据进行相关的科学算法处理,通过关联形式的分析技术对数据进行进一步的处理和分析,从而得出相应的规则和模式。
1.3 模式分析与应用 WBE挖掘过程的最后一步就是模式的分析与应用,该过程主要是对模式发现过程中的一些规则模式进行进一步的筛选,删除上阶段的一些无价值内容,从而提供更为精确的数据,在该过程中整个系统框架包括离线和在线推荐引擎两部分。在线部分主要是对推荐、融合等内容的分析,离线部分则是对数据准备和知识挖掘的相关处理,由于挖掘处理需要较长时间,因此被设计为离线部分,以避免对实时性要求的影响;针对不同用户快速生成各种推荐服务。
2 基于WEB的数据挖掘技术的应用
与传统的数据分析相比较,大数据分析的一个重要目标就是从海量、数据繁多的数据库中找出隐藏的规律,使数据库发挥最大的价值。数据的价值远不止于数据本身,而是隐藏在数据之间的关系隐含的知识。比如,现在企业与客户之间的接触途径和界面越来越丰富,而这些途径承载了客户与企业之间、客户与产品之间、客户与品牌之间的大量互动信息与数据。如果可将这些数据整合,企业便有更多的机会准确了解现有的用户及挖掘潜在的用户群体。以用户需求为中心包含两层含义:第一是通过对用户需求的了解从而设计相关服务措施和安排,第二是对信息环境的设计要根据不同的客户需求而建立,组织信息资源,提供多样化服务。
2.1 信息资源多元化 这种方式主要是根据馆藏资源的合理配置和管理而建立的,该资源组织体系的建立能够为相关人员提供一个巨大的数据库,查询变得方便快速,并且个性化的服务方式能够包含指向丰富信息内容的链接,力争达到让用户即需即得的效果。
2.2 具有智能化分析和挖掘用户需求的功能 信息的技术发展实现了智能化分析的方式,智能化的分析能够对用户的浏览信息进行主动的采集,大大减轻了人工负担,主动对用户的日常检索以及兴趣需求进行总结分析,并且推理出用户的相关需求,从而可以对相关用户或者类似用户进行信息推荐,提高工作效率,使需求相同的用户之间共享查询结果。
2.3 推荐信息的准确性、高效性 推荐信息的准确化是数据挖掘的主要追求方向,个性化的服务目标就是为用户推荐的信息高效、准确。数据挖掘工作中主要是通过信息过滤、信息处理、信息分析等技术排出一些无意义信息,精确推荐可用信息,从而将大量信息智能的转化为用户真正的需求内容,从而提高服务效率,为用户减轻数据搜索的负担。
2.4 各子模块功能 ①数据准备模块。数据准备模块的作用主要是通过对原始用户的日志和访问进行数据的采集和清洗等,该准备工作对于挖掘阶段来说能够对于用户的文件以及事物数据等生成相关数据文件从而为后续工作提供数据基础。②建立用户兴趣模型库模块。用户兴趣模型库模块主要是通过WEB挖掘技术对用户的相关信息以及用户的访问情况进行综合分析,对于用户的兴趣进行了解并且能够根据信息资源的相关做出矢量描述,从而对用户的要求更科学的匹配,及时根据用户的要求对用户模型进行更新和完善。③建立推荐池模块。推荐池模块主要是通过用户的访问记录以及用户评价对用户的访问页面进行综合分析和集合,从而更好的满足用户需求。
3 结语
综上所述,数据的快速增长提高了数据的可利用性但同时也对数据的搜索增加了难度,如何正确高效的利用有关数据是我们的一个重要方向,传统的数据利用方式很难做到数据的精确利用,数据挖掘技术有效的改善了这种状况,通过可视化技术、挖掘技术等对数据进行一个科学的分析和预测,从而提高了数据的可利用率和效率。
参考文献:
[1]喻瑶瑶.基于web的数据挖掘系统设计研究[J].电脑迷,2014(7):39.
[2]龚林峰.基于WEB的数据挖掘系统在医院管理中的应用[J].电脑知识与技术,2015(8):1-2.
[3]徐旭,姜飞.基于Web数据挖掘简述[J].福建电脑,2008,24(6):39,18.
关键词:WEB使用挖掘;在线;网站;应用
0 引言
随着经济和科技的快速发展,互联网技术的应用也越来越广泛,但是由于互联网内容的日益扩增,信息的过载现象越来越明显,信息的迷失对于人们的互联网利用来说有所制约,互联网中广阔的空间和信息如何得到有效和充分的利用,如何对个人兴趣或者需求快速的定位并实现是一个非常重要的问题,WEB数据挖掘是这种大环境下推出的一项综合性技术,主要就是指WEB 从文档结构和使用的集合C 中發现隐含的模式P,如果将C看做是输入,P 看做是输出,那么WEB 挖掘过程就可以看做是从输入到输出的一个映射过程。基于WEB的数据挖掘技术就应运而生。
1 基于WEB的数据挖掘技术的概况
数据的挖掘顾名思义就是从大量的、模糊的、随机的、不确定性的信息数据库中选择有价值的数据信息和知识,这是一个寻找的过程,也是一个决策支持的过程,数据挖掘的实现依赖于人工智能、机器学习、模式学习、统计学等技术。数据挖掘的基本原理就是通过对大量数据的分析进行推理和预测,这种分析是自动化的,大大减轻了人工的负担提高了工作的效率,从分析中对潜在模式和有用信息进行有效的挖掘,对于企业、商家以及各方面的用户来说都具有非常重要的意义,是决策的一个科学基础,很多领域都已经应用到了WEB数据挖掘技术,解决了相当多的相关难题,常用的数据挖掘技术有回归分析、神经网络、聚类等,这些方法能够对数据进行不同角度的全方位挖掘,实现数据的可视化和精确。
WEB在数据的挖掘过程中通常是三个阶段,包括数据的预处理、数据的模式发现、模式的应用分析。
1.1 数据预处理 该服务器的应用并不是针对数据挖掘而设定的,这就需要在WEB使用的过程中首先要进行过滤处理,对于数据的不完整以及模糊、不一致等问题进行一个初步的筛选,从而生成一个新的数据库,这就是数据的预处理工作,预处理的工作对于后续工作来说是一个重要的基础,能够对挖掘算法的产生模式和规则直接影响。
1.2 模式发现 挖掘算法的重要过程之一就是模式发现,这是挖掘算法的实施内容,对于预处理之后的数据进行相关的科学算法处理,通过关联形式的分析技术对数据进行进一步的处理和分析,从而得出相应的规则和模式。
1.3 模式分析与应用 WBE挖掘过程的最后一步就是模式的分析与应用,该过程主要是对模式发现过程中的一些规则模式进行进一步的筛选,删除上阶段的一些无价值内容,从而提供更为精确的数据,在该过程中整个系统框架包括离线和在线推荐引擎两部分。在线部分主要是对推荐、融合等内容的分析,离线部分则是对数据准备和知识挖掘的相关处理,由于挖掘处理需要较长时间,因此被设计为离线部分,以避免对实时性要求的影响;针对不同用户快速生成各种推荐服务。
2 基于WEB的数据挖掘技术的应用
与传统的数据分析相比较,大数据分析的一个重要目标就是从海量、数据繁多的数据库中找出隐藏的规律,使数据库发挥最大的价值。数据的价值远不止于数据本身,而是隐藏在数据之间的关系隐含的知识。比如,现在企业与客户之间的接触途径和界面越来越丰富,而这些途径承载了客户与企业之间、客户与产品之间、客户与品牌之间的大量互动信息与数据。如果可将这些数据整合,企业便有更多的机会准确了解现有的用户及挖掘潜在的用户群体。以用户需求为中心包含两层含义:第一是通过对用户需求的了解从而设计相关服务措施和安排,第二是对信息环境的设计要根据不同的客户需求而建立,组织信息资源,提供多样化服务。
2.1 信息资源多元化 这种方式主要是根据馆藏资源的合理配置和管理而建立的,该资源组织体系的建立能够为相关人员提供一个巨大的数据库,查询变得方便快速,并且个性化的服务方式能够包含指向丰富信息内容的链接,力争达到让用户即需即得的效果。
2.2 具有智能化分析和挖掘用户需求的功能 信息的技术发展实现了智能化分析的方式,智能化的分析能够对用户的浏览信息进行主动的采集,大大减轻了人工负担,主动对用户的日常检索以及兴趣需求进行总结分析,并且推理出用户的相关需求,从而可以对相关用户或者类似用户进行信息推荐,提高工作效率,使需求相同的用户之间共享查询结果。
2.3 推荐信息的准确性、高效性 推荐信息的准确化是数据挖掘的主要追求方向,个性化的服务目标就是为用户推荐的信息高效、准确。数据挖掘工作中主要是通过信息过滤、信息处理、信息分析等技术排出一些无意义信息,精确推荐可用信息,从而将大量信息智能的转化为用户真正的需求内容,从而提高服务效率,为用户减轻数据搜索的负担。
2.4 各子模块功能 ①数据准备模块。数据准备模块的作用主要是通过对原始用户的日志和访问进行数据的采集和清洗等,该准备工作对于挖掘阶段来说能够对于用户的文件以及事物数据等生成相关数据文件从而为后续工作提供数据基础。②建立用户兴趣模型库模块。用户兴趣模型库模块主要是通过WEB挖掘技术对用户的相关信息以及用户的访问情况进行综合分析,对于用户的兴趣进行了解并且能够根据信息资源的相关做出矢量描述,从而对用户的要求更科学的匹配,及时根据用户的要求对用户模型进行更新和完善。③建立推荐池模块。推荐池模块主要是通过用户的访问记录以及用户评价对用户的访问页面进行综合分析和集合,从而更好的满足用户需求。
3 结语
综上所述,数据的快速增长提高了数据的可利用性但同时也对数据的搜索增加了难度,如何正确高效的利用有关数据是我们的一个重要方向,传统的数据利用方式很难做到数据的精确利用,数据挖掘技术有效的改善了这种状况,通过可视化技术、挖掘技术等对数据进行一个科学的分析和预测,从而提高了数据的可利用率和效率。
参考文献:
[1]喻瑶瑶.基于web的数据挖掘系统设计研究[J].电脑迷,2014(7):39.
[2]龚林峰.基于WEB的数据挖掘系统在医院管理中的应用[J].电脑知识与技术,2015(8):1-2.
[3]徐旭,姜飞.基于Web数据挖掘简述[J].福建电脑,2008,24(6):39,18.