Web文本信息抽取与挖掘方法

来源 :长春工业大学学报(自然科学版) | 被引量 : 0次 | 上传用户:Kaspersky_
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web信息资源中蕴含着具有巨大潜在价值的知识。人们迫切需要能够从Web上快速、有效地发现资源和知识的工具,搜索引擎不能完全满足这一要求,为此需要开发比信息检索层次更高的新技术。文中以Web文本为研究对象,着眼于将数据挖掘技术应用于Web挖掘,兼顾中英文文本,提出了一套Web文本的特征表示,特征提取及Web页面的结构化转换方法,并将粗糙集理论应用于转换后的Web文本挖掘。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
资源的过度消耗和环境的日益恶化已经严重地阻碍了经济社会的发展,为此工业企业必须改变发展模式,实行清洁生产。本文从蚌埠市清洁生产发展现状出发,分析了推行和实施清洁生
【德国《法兰克福汇报》1992年5月29日报道】 1992年5月27日,世界卫生组织(WHO)排除了人们对辐照食品的疑虑,并称此方法可能延长食品保存期和战胜世界的饥荒。WHO在日内瓦发
介绍了新合纤的国内外研究、开发及市场情况,指出新合纤是未来合纤发展的必然趋势。我国在新合纤的开发上起步较晚,与世界先进水平差距很大,建议在调整合纤产业结构的同时,应组织
[摘要] 目的 分析脓毒性休克患者外周血中性粒细胞/淋巴细胞比值(NLR)、血小板/淋巴细胞比值(PLR)与凝血指标的变化及其临床意义。 方法 回顾性分析我院2015年1月~2019年8月收治的脓毒性休克患者76例,将其分为预后良好组与预后不良组,对比两组患者治疗开始与结束时的NLR、PLR与凝血指标。 结果 两组患者在治疗开始时的NLR与APTT存在显著性差异,而PLR与D二聚体无明显差异;治疗
【正】 【《瑞士原子能协会通报》1991年第6期第17页报道】自1991年2月法国格拉夫林核电厂在一次检查中发现6号机组的两个超压阀门处于闭锁状态之后,法国电力公司(EDF)命令对
如何改变世界:马克思和马克思主义的传奇作者是享誉全球的思想大师、备受推崇的马克思主义史学大家。在《共产主义宣言》发表以来的一个半多世纪中,马克思主义一直是现代世界思
[摘要] 目的 探讨奥曲肽在ERCP术后高淀粉酶血症和急性胰腺炎发生中的预防作用。 方法 选取我院于2018年1~12月收治实施ERCP术治疗的患者55例,将其分为观察组36例和对照组19例。观察组给予醋酸奥曲肽注射治疗,对照组给予常规的抑酸、抗感染治疗。对比两组血清淀粉酶、血糖水平、术后并发症、不良反应发生情况以及临床疗效。 结果 两组术前的血糖水平比较差异无统计学意义(P>0.05),经3 h
【《瑞士原子能协会通报》1993年第4期第10页报道】1993年1月底,卡尔斯鲁厄核研究中心在其第4次现状报告中,向国内外200余名专家报告了关于德国在研究直接最终贮存乏燃料元件