新闻网页主题内容提取方法研究

来源 :微计算机应用 | 被引量 : 0次 | 上传用户:otaku2456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网页的半结构化特点与新闻的自身特征为选择性抽取网页内容创造了条件。我们在前人的研究基础上,挖掘Web页面结构特征、充分利用Html标记与新闻特征,重点从Web页面编者对文本修饰角度出发,提出了基于网页内容分割的主题内容抽取方法。实验结果表明该方法能有效地抽取新闻各要素,测试的抽取准确率在96%以上。
其他文献
从某种意义上讲,营林前造林整地的质量会对后期树林的生长产生直接影响,造林整地可有效改善造林立地条件、提高土壤的通透性,以达到促进幼林生长、提高林木成活率及造林品质
在△ABC中,AA1为中线,AA2为角平分线,K为AA1上点,使KA2∥AC,证明:AA2┴KC。
本文以便携式土壤水分采集仪应用过程中,在选定的实验区内,对同一采样点探针相对不同位置插入土中监测土壤含水量的差异,以人工烘干法测取土壤含水量为参照,通过数据分析比较,确定探针完全插入土中监测土壤含水量的正确性。
为探讨油菜平衡配套施肥技术的增产效应,2005-2006年度在湄江镇的新街村实施了油菜N、P、K、B肥料配施试验。通过同田对比,平衡配套施肥比习惯施肥亩增产36.4kg,增产百分率为22.6%
基于IEEE 1149.1 JTAG架构,本文设计了一个嵌入式调试接口.从该接口的整体结构划分到内部各组成单元的设计,进行了详细的阐述.经过仿真验证,证明其设计可靠、方案可行,具有很
网络计费和流量控制都是网络管理的组成部分,网络计费中的流量计算计费是一种重要的计费方式,而对流量计费来说,计费用的流量信息采集则是关键。本文提出了一种高效的流量信息采
<正> 掌握知识,训练思维,学会学习,学会创造,是高三数学教学的目标.这不仅是高考的需要,也是学生持续性发展、继续学习的需要,更是培养创造型人才的需要.课堂讲授,是目前中学
羊传染性胸膜炎是我国部分地区在引进小尾寒羊后新兴的一种动物传染病,对于羊群养殖有重要作用。下面本文以湟源县21世纪初的羊群传染病防治作为研究案例,进行研究。湟源县羊
素质教育是面向全体学生的教育,它要使每个学生在原有的基础上都得到应有的发展。与过去的应试教育只重视优秀生,忽视后进生的做法完全相反,在全社会都普遍重视素质教育的今天,我
营林技术在环境中的应用,是促进森林资源有效开发的重要手段,本篇文章主要从营林技术的应用现状入手,对营林技术在环境中的应用情况进行了探究。