Web日志预处理的Clementine方案

来源 :中华医学会第十五次全国医学信息学术会议 | 被引量 : 0次 | 上传用户:hahahaha8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了对Web日志进行预处理,通常首先将日志导入到某种数据库中,然后借助数据库管理系统(DBMS)提供的功能完成相关的预处理操作,或者直接交给目前比较成熟的Web日志分析工具,如Awstats、Webtrends等。但无论是DBMS还是Web日志分析工具,它们的挖掘能力相对来说都比较弱,难以满足后期Web日志挖掘的目标,因而还需要将预处理好的日志重新导出交给其他挖掘软件进行处理。SPSS公司整合开发的Clementine数据挖掘工具平台,作为新一代数据挖掘软件,不仅提供了大量的人工智能、统计分析模型,而且提供了与数据准备有关的常用工具,包括选择、排序、筛选、分类、关联等,这为Web日志挖掘以及预处理工作提供了充分的可能。本文重点探讨利用Clementine对Web日志进行预处理的可行性以及具体的操作步骤,为下一步在该平台上开展日志挖掘工作做准备,从而可大大提高Web日志挖掘的自动化程度。
其他文献
5 日本、美国、台湾地区保健 (功能 )食品的发展现状及管理情况5.1 日本保健 (功能 )食品据资料介绍 ,日本 70年代保健 (功能 )食品的年产值约 1亿美元 ,80年代约 1 0亿美
本文对卫生监督进行概述,介绍了卫生监督网络平台建设现状与卫生监督信息系统的技术支持,指出随着社会信息化和我国卫生监督事业的发展,人们对卫生监督网络信息平台的应用将会越
会议
1949年8月26日,打下兰州后,彭德怀召集干部开了一个会,破例要在兰州宴请团以上的干部。因为当时的干部比较年轻,很快就把饭吃光了。管理科长就让饭店给每桌上一些点心。吃完
随着我国加入WTO,这就要求科技期刊与国际接轨的步伐加快。作为传播科技信息的最大载体——科技期刊,其国际竞争愈趋激烈,我国科技期刊不可回避地走国际化之路已成为现实并将不
会议
创作自述在西方图家均放弃传统写实这一绘画表现方式之时,我们是否应该一味效仿他们,而放弃这种在我国业已完善,同时也未必过时的表现方式呢?事实上,传统写实的绘画表现方面,
居民电子健康档案中需要包含居民在各种卫生组织或机构中关于健康历史与服务的数据信息。对于数据来源于社区可以采集到居民电子健康档案系统中,而那些居民在医院检查或医疗过
会议
新医改提出了“一顶、四梁、八柱”的方案,信息化成为该方案中唯一的技术支柱。信息化是实现卫生改革的跨越式发展的技术保障,通过卫生服务信息化,实现方便而快捷的医疗服务,及时
医疗卫生行业是一个信息密集的行业,也是一个高度依赖信息的行业。医疗活动的自身就是一个不断进行信息采集处理的过程。医疗卫生行业的信息建设将直接关系到医疗科学发展的水
会议
在科技迅猛发展的今天,如何准确、科学、迅速地把握某领域的研究前沿不仅是科研人员也是决策者们所关心的焦点。“研究前沿”(Research Front)这一概念最早由美国科学计量学家普
会议
采用大鼠 2 0只 ,通过饮水加氟 (F15 0mg/L)和加硒 (SE 0 5mg/L、2mg/l、4mg/L)的方法 ,研究氟、硒对大鼠股四头肌的组织化学活性变化的影响。结果表明 :氟组股四头肌PAS反