基于随机冲浪模型的XML文摘句子重排

来源 :NDBC2009第26届中国数据库学术会议 | 被引量 : 0次 | 上传用户:porminor100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在使用句子抽取的方法对多文档的XML文本进行文摘的过程中,必须通过对句子进行重排才能得到一个逻辑合理、内容连贯、可读性好的文摘.提出一种基于随机冲浪模型的方法对XML文摘进行句子重排.通过句子间的顺序关系(时间顺序、前后位置、句子所在文档树中的层次)和主题相关性关系的线性组合为边的权重,以句子为结点建立一个有向图,使用PageRank算法得到句子的分值并按该分值大小重排XML文摘中的句子.实验结果表明,模型能有效提高文摘内容的逻辑合理性、连贯性和可读性.
其他文献
序列模式挖掘就是在时序数据库中挖掘相对时间或其他模式出现频率高的模式.序列模式发现是最重要的数据挖掘任务之一,并有着广阔的应用前景.针对静态数据库,序列模式挖掘已经被深
会议
从海量移动用户通话记录中,根据用户的行为模式对用户进行分类挖掘.主要贡献包括:1)提出了生活熵的概念,用以刻画移动用户行为的规律性;2)提出基于生活熵的个人用户行为的分类算
完整性是数据质量的一个重要维度,由于数据本身固有的不确定性、采集的随机性及不准确性,导致现实应用中产生了大量具有如下特点的数据集:1)数据规模庞大;2)数据往往是不完整、
会议
叶问,咏春拳的创立者,李小龙的师父。对于粤人来说,叶问这个名字有着和黄飞鸿、李小龙一样的意义。佛山有个黄飞鸿堂,也有一个叶问堂。佛山当地每个人都能讲一段叶问的故事。    出身佛山望族    叶氏家族是佛山望族之一,祖居于佛山福贤路,号称“桑园”。“桑园叶姓”在佛山,可说是无人不知。  叶家有一位小少爷,排行第二,名“继问”,虽自幼受严谨的儒家教育,却偏好三件事——玩枪、玩雀、玩功夫。  叶问在7
[关键词]班主任 讲究方法 宽容 健康成长    班主任是学校教育工作的领导者、组织者,实施者,是教学工作的协调者,班级管理要求班主任热衷于本职工作,尽职尽责,持之以恒,讲究方法,对学生的关爱贯穿于班级管理的每时每刻。  班主任在学习和纪律上严格要求学生的同时,更要把“人文教育”理念贯彻其中,要把更多的爱心、关心、赞赏、宽容、接纳洒向每一个学生,呵护、唤醒每一个学生稚嫩的心灵。平时,要留意学习困难
[摘要]两极分化一直是英语教学中让所有英语教师头疼的问题,本文从英语学困生产生的原因开始分析,着重从教学与检测两个方面谈了如何对英语学困生采取恰当的激励性措施,让学困生感受到成功的喜悦。  [关键词]英语教学 学困生 英语兴趣    一、学困生产生的原因    产生学困生的原因一般有两种情况:一是学法不当,二是缺乏兴趣。对于学法不当的学生,任课教师只要进行恰当的学法指导,情况都能有所改观。而对于缺
频繁项集挖掘是数据流挖掘中的一个热点问题.提出了一种新的数据流频繁闭项集挖掘算法MFCI-SW.首先设计了两个新的数据结构:频繁闭项集表FCIL和频繁闭合模式树MFCI—SW—Tree,在
会议
法语里,赵无极写作Zao Wouki。这个名字出现在艺术界,代表炉火纯青;出现在艺术品市场上,则意味着稳定保值。在2009年胡润艺术榜上,赵无极以总成交18202万元位于榜单第5位,排
传统item-baseol协同过滤算法根据项目之间的相似性来选取最近邻居.然而,现存的几种相似性度量方法都存在相应的弊端,因此只根据相似性无法找到准确可靠的最近邻.根据对两项目共
会议
[摘要]多媒体作为一种现代化的教学手段,在教学中的优势是不言而喻的,他可以在轻松愉快的气氛中,在不增加学生负担的情况下,起到有意注意不能起到的作用,从而调整学生的学习心理。在教学中,还可以凭借多媒体课件的声像手段创造教学意境,带领学生走进教材,开发思维。多媒体教学有赖于手脑并用,让学生操作使用电脑,可以训练学生的动手能力,让学生自主地进行学习。我们应根据课程特点、教材内容、教学对象有选择性地加以使