人造数据库与测试平台的研究与实现

来源 :吉林工业大学 吉林大学 | 被引量 : 0次 | 上传用户:caicai_0326
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在KDD(数据库中知识发现)领域中,数据挖掘算法的研究尤为引人注目,各种各样的 数据挖掘算法相继出现,仅凭借传统的算法评价手段已经不能满足对于海量数据库上的算法评价的需要.为此,除了评价算法的时间复杂度和空间复杂度外,在该文中首次提出或运用了包括析取率、新颖程度、准确率、兴趣度等与数据挖掘算法密切相关的指标.通过模糊综合评价的手段,创建了相应的算法综合评价模型.在此思想的指导下,建立了一个基于人造数据挖掘算法综合测试平台.数据挖掘算法挖掘的对象是海量的数据库,为了在测试平台中构建如此大规模的数据库,在该文中采用了人造数据生成技术.其数据的构成采用了面向问题的人造数据生成思想,而不是采用面向模拟的人造数据生成模型.由于人造数据本身是面向测试技术指标的,因此能够更为全面地检测数据挖掘算法的各种性能指标,进而为算法综合评价奠定了基础.
其他文献
防火墙技术是目前解决网络安全问题的一种重要手段.该文对防火墙的概念、作用以及目前较成熟的防火墙技术和基本组件进行了详细的分析,并在此基础上,结合他人的研究成果和自
云计算是一种将计算资源作为公共服务的新兴计算模式,有着使IT业发生巨变的潜能。随着越来越多的企业将云计算应用到企业管理中,云计算面临着巨大的发展前景。但同时,随着获
该文面向视频信息中的中文字幕以及视频流的特点,以中文字幕作为视频的内容特征,并结合了传统的基于关键字的数据库查询技术,进行场景分割以及中文字幕的提取、中文字幕的识
该文在阐述WFMS和传统管理信息系统(Management Information System,简记为MIS)基本概念和基本理论的基础上,讨论了现有WFMS和MIS的优势与限制,论证了建设基于工作 流的商业
通过对国外若干个作业管理进行分析,研究人员发现到它们存在的一些问题,主要表现在:各个系统的实现方法各不相同,虽然现在已经有关于作业管理系统的行业标准(POSIX 1003.2d),
该文是根据对于VXI总线测试软件平台的设计要求,对整体方案和主框进行设计,对 平台主框架中的若干算法的实现加以讨论.该文第一章中主要介绍关于VXI总线测试平台系 统整体方
该文对UML的研究工作主要集中在建模方法和思路,而不是建模的实现技术上.因此,UML建模方法是该文讨论的重点.该文在深入理解UML语义,总结面向对象技术开发经验,研究特定领域
该论文主要讨论了局域网上实现的多媒体音频会议系统中,引入语音识别技术,利用语间识别的方法对会者的发言进行识别,将语音信号转变成文本信号,保存后地其进行编辑修改,作为
该文从模型、语言和环境方面对协调进行了系统化的研究,具有重要的理论意义和实用价值.该文根据应用的需求,提出了Concerto模型.Concerto模型以Petri网为数学理论基础,引入了
软件体系结构逐渐成为软件工程领域的热点和关键技术。本文首先介绍了软件体系结构从“无体系结构”的设计到基于体系结构的软件开发所经历的四个阶段,然后阐述了进行基于构件