大文本数据快速分析统计理论与算法

来源 :电子元器件与信息技术 | 被引量 : 0次 | 上传用户:yaohaochang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在我国电力信息化快速发展的背景下,有大量的网络文本数据在电力系统中产生,这就在一定程度上增加了信息资源数量。其中,这些海量数据绝大多数属于无用信息,不存在研究价值。而其大规模的数据积累,却导致处理传统文本工作繁琐。为此,在数据繁杂的条件下,快速而又精准地捕捉目标数据,再对其进行相应的分析和处理,最终获得具有高价值密度的信息数据意义重大。本发明属于一种大数据的数据采集、过滤、统计的算法。通过对大文本数据文件做有效切割,实现对数据的并发高效分析,然后按照业务需求将分析结果汇总,呈现出有价值的数据。
其他文献
目的:探讨高龄患者在人工髋关节置换术后的护理和康复经验;方法:收集我院97例实施髋关节置换术的高龄患者,对其进行科学的护理和康复指导;结果:本组病例经科学合理的护理和康复指导
记得,那一年,那一天,他们相聚在那片桃花林。 那时的他们,还只有十一二岁。 那时,他对她说,你等着我,五年后,我拜师回来,就娶你。 他点点头,抬眼看他,严重洋溢着幸福与感动,
分析了普通采煤钻头存在的弊病,阐述了钻头改进的依据,列举了改进后的采煤钻头的优点和现场试验效果。
专业核心竞争力的强弱直接关系到一个专业能否生存,也直接关系到专业培养的学生就业与发展,建设好高职汽车制造与装配技术专业核心竞争力评价体系将对专业的发展有很大的提升
目的:探讨复方樟柳碱治疗眼肌麻痹的临床分析。方法:选取2005年1月~2011年1月我院糖尿病导致的外直肌麻痹患者共100例,随机分为观察组与对照组各50例,其中观察组在常规治疗原发病
由于港口扩建工程,连云港地区每年有数百万立方米的泥土集中排抛于局部海域。废弃土在排抛区内形成淤积并影响着底栖动物的栖息环境。作者于1986年和1988年在连云港海域进行
时代的快速发展,带来了经济的迅猛增长,同时对资源的需求也越来越多。为了促进可持续发展,带动绿色经济增长,促进资源的循环利用,就对社会环境提出了新的要求。森林资源多样,
随着城市化建设进程的不断推进,园林花卉建设逐渐成为美化城市绿色景观的重要环节,对实现园林景观的进一步改造和美化起着重要作用。但是,在种植园林花卉的过程中,经常会遇到
期刊