【摘 要】
:
[目的/意义]作者身份识别是语言文体学的重要研究方向,利用文本特征的身份识别也是文本挖掘的重要任务.在开放和虚拟网络环境下海量信息的作者身份或发布者的识别难题和传统
【机 构】
:
西安电子科技大学经济管理学院 西安710126
论文部分内容阅读
[目的/意义]作者身份识别是语言文体学的重要研究方向,利用文本特征的身份识别也是文本挖掘的重要任务.在开放和虚拟网络环境下海量信息的作者身份或发布者的识别难题和传统作者身份识别方法在处理效率和成本等方面存在的问题有待解决.[方法/过程]将复杂网络理论引入该研究领域,在利用传统文体学特征识别作者身份方法的基础上结合文本词共现网络模型及其指标特征改进相关算法,使用文本文体学特征和文本网络模型度量指标构建作者风格特征集合,通过计算文本间风格相似度进行作者识别.[结果/结论]基于复杂网络模型的作者身份识别方法可以有效的利用作者风格特征,提高识别的精度,与其他算法的对比试验表明其识别结果的准确性更高.
其他文献
高等院校核心竞争力是一个复杂和多元的系统,是一个由构成高等院校竞争力的核心要素整合而成的有机整体,其核心也就足基于知识之上的一种独特的、具有长期竞争优势的、能持续发
自20世纪80年开始,随着电子网络技术发展,政府信息服务也开始进入迅速发展时期,特别是在2008年5月1日《中华人民共和国政府信息公开条例》实施以来,政府信息服务更是跨上了一
随着我国城市化进程的加快,我国的城市出现了日新月异的变化,但在快速发展的同时,城市失去了许多永远无法复得的东西-历史文脉。为了抢救“城市记忆”,各地各相关部门纷纷启
[目的 /意义]了解美国常春藤联盟8所高校图书馆面向校外读者服务情况,为我国高校图书馆开展此项服务提供借鉴。[方法 /过程]采用网络调查法,从开放对象、入馆方式、收费情况
信息资源整合是目前信息资源管理的研究热点,本研究提出运用信息可视化方法指导信息资源整合,采用信息可视化思维进行信息资源整合,实现信息资源的有效增值。
本研究采用文
随着人们面临的信息环境变化,学术图书馆的作用和地位正受到其他信息提供者多方面的挑战,图书馆面临着激烈的资源、用户、服务等多种竞争。而科学技术的飞速发展使得同种商品在
目的医院通过实施知识管理可以整合医院的知识资源,提高医院的知识应用水平。医院中的大量知识是存在于业务流程中的,其医疗业务流程是知识密集型业务流程,且医疗业务流程中的人即医务人员本身也是知识载体,拥有丰富的隐性知识。本研究提出在医院实施知识管理要引入基于业务流程知识管理模式,探讨知识管理与医疗业务流程的结合。通过分析医疗业务流程及其知识流程,提出相应的知识管理措施,以期提高医院整体知识管理水平。方法
在新近一期的《人民论坛》上,胡鞍钢发文就中国为何能打破“国强必霸”的逻辑发表看法.rn胡鞍钢说,中国倡导的“共赢主义”是人类发展的必然结果,是二十一世纪人类共同进步的