【摘 要】
:
基于本体的文本聚类方法,在文本表示上引入WordNet,并定义了关键概念集,使用WordNet中的概念节点及概念间的语义关系减少文本特征向量维数,提高聚类效果.聚类过程中,算法使用文本的
【机 构】
:
吉林大学计算机科学与技术学院,吉林大学符号计算与知识工程教育部重点实验室
【基金项目】
:
国家自然科学基金(批准号:60973040,60903098)、教育部高等学校博士学科点专项科研基金(批准号200801830021)、吉林省自然科学基金(批准号:20070533)和吉林大学基本科研业务费交叉学科与创新项目基金(批准号:200810025)
论文部分内容阅读
基于本体的文本聚类方法,在文本表示上引入WordNet,并定义了关键概念集,使用WordNet中的概念节点及概念间的语义关系减少文本特征向量维数,提高聚类效果.聚类过程中,算法使用文本的关键概念集和概念特征向量计算文本相似度,利用文本的关键概念集标注聚簇为聚类结果中的各个簇提供解释.实验结果表明,该方法有效地减少了文本特征向量的维数,提高了文本聚类效果以及聚类结果的可解释性.
其他文献
跨国直接投资的特殊属性以及实现国家政策目标、保障FDI健康发展和防止FDI行为扭曲,是政府对FDI流出进行政策干预的充足理由。通过对FDI政策目标的解读,中国FDI政策应从单纯的激励政策向“激励——抑制——中性”三位一体政策体系转变。中国FDI政策规制应加以改进:逐步变审批制度为登记制度;以激励的政策开拓国际市场和利用境外资源;建立和完善对外直接投资信息咨询服务体系;加速完善中国境外投资立法;利用财政金融手段调节企业跨国经营行为.
6月12日,中国家用电器协会电冰箱专业委员会(以下简称电冰箱专委会)2018年换届工作会议在福建连城召开。此次会议由中国家用电器协会主办,福建赛特新材股份有限公司协办。中国
2018年1月12日,彩虹股份拟与康宁新加坡控股有限公司在陕西咸阳市高新区共同出资设立和运营一家中外合资企业,建设8.6+代TFT-LCD玻璃基板后段加工生产线.合资企业注册资本为20
采用计算任务量大小的方法,解决了在紧嵌套循环自动并行化过程中存在循环并行化的并行粒度确定问题以及循环自动并行化中数据划分的数据访问局部性问题,在多核系统中实现了紧
证明了下列结果: 设R是一个2-非挠质环; J是一个Jordan理想, 且是R的子环. 如果φ: R→R是一个自同构, 且对所有的u∈J, 满足: φ(u2)=φ(u)2, 则对所有的u,v∈J, 有φ(uv)=
2018年1月22日,凯盛科技发布公告称,已委托下属公司蚌埠国显科技有限公司管理团队,专门运营TFT-LCD玻璃面板减薄业务.蚌埠国显拟新增投资5990万元,对现有TFT-LCD玻璃面板减薄
在家电行业,净水产品是较为特殊的存在,一方面,源于用户对水污染的关注,净水产品普及迅速;另一方面,几千家的生产及销售企业,面对拥有巨大潜力,且标准尚不完善的市场,产品质
考虑一类偏微分包含问题:-Δu∈G(x,u).当集值函数G(x,u)取有界紧凸值的、关于变量x是可测的、关于变量u是闭图像时,运用Kakutani-Fan不动点定理,证明了边值解的存在性,且解集是弱
针对定焦虹膜采集设备采集的离焦降质虹膜图像,提出一种基于正交离散多方向小波变换的正则化虹膜图像恢复算法,并对提出的算法进行了系统检验.结果表明,所提出的改进算法对虹膜图像恢复的研究有一定的意义.
通过分析探讨影响扬子石化公司丁二装置长周期运行的两个主要问题,结焦、泄漏采取优化工艺指标、调整工艺流程、化学浸泡清洗、增加设备台等措施,从而达到了丁二烯装置两上一修