基于多因子算法的自动分类研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:fdsth5x1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]从实用角度出发,研制领域适用性广、人力投入少的分类标引方法,支撑海量信息资源分类管理与学科领域地图揭示.[方法]基于文献中代表主题概念的术语、概念等关键词和分类号的兼容关系,研究设计多因子加权分类算法,在此基础上提出全流程自动分类标引方案.[结果]以权威的多领域标注语料库和标准集为数据来源进行分类标引实验,单类号文献标引准确率84.1%,召回率79.8%,F值81.9%;双类号文献标引准确率83.4%,召回率78.8%,F值81.0%0[局限]学科分类标引的准确率及完整性依赖高质量标注语料库,且在多类号资源的标引上有待提升.[结论]本文提出的多因子算法自动分类标引具有较高的可操作性和实践应用价值.
其他文献
  从微生物代谢产物中寻找结构新颖的药物先导化合物是新药筛选的一个重要方向.深海来源的真菌由于其特殊的生存环境往往可代谢产生多样性丰富、结构新颖的次级代谢产物,但
会议
【目的】探索共享平台中不同主体的信息线索及其线索一致性对用户购买决策的影响机制。【方法】以线索一致性理论为基础,从房客文本线索(UGC)和房东图片线索(MGC)角度构建模型,利用爬虫技术在共享住宿平台网站上获取相应房源数据,研究信息线索一致性对消费者购买决策的影响。【结果】UGC的文本线索和MGC的暖色调图片显著正向影响用户购买决策,UGC与MGC的信息线索一致性程度对用户购买决策具有显著正向影响
  以核桃加工下脚料核桃壳部分或全部代替常用培养料中木屑、玉米芯进行刺芹侧耳(Pleurotus eryngii)(杏鲍菇)栽培研究.试验结果表明,使用核桃壳代替玉米芯的配方1(木屑34%、
  香菇(Lentinula edodes)是世界上产量第二的栽培食用菌,同时是我国产量居于第二的重要栽培食用菌,也是我国大宗出口食用菌种类.但是由于多年的分散生产和自身无性繁殖的特
会议
  微生物产物是新药及其先导结构的一个重要来源。随着现代生物工程技术的发展,虽然对尚无法分离培养的微生物也可以不经分离而从基因组DNA水平探索其代谢产物,但可分离培养
  开展食用菌白化现象的研究可选育出性状优良的新品种.蛹虫草(Cordyceps militaris)的商业化人工栽培已经有二十多年,生产品种中以橙红色子实体为主,其他品种鲜有报道.蛹
  美味冬菇(Panellus edulis),肉质肥厚、细嫩清香、富含蛋白质、多种维生素及矿物质等,产品既可干品上市又可鲜品上市,是我国东北地区著名的名贵食用菌,近些年来已经能够进行
  我国是香菇(Lentinula edodes)驯化栽培最早的国家,也是香菇的第一大生产国和出口国。但在我国香菇菌种市场上,同物异名和同名异物现象严重,"盗舨"品种随处可见,育种者权
会议
  作为一种常见的食药用真菌,蛹虫草(Cordyceps militaris)的相关研究越来越多。而在继代培养过程中,菌株容易发生退化现象, 主要表现为不再产生主要具药用价值的子实体,给
近日,发表在Proceedings of the National Academy of Sciences上的一篇文章中,来自英国和爱尔兰的研究人员使用数据科学和网络理论共同解开了《权利的游戏》所改编自的小说
期刊