基于隐性语义索引的多标签文本分类集成方法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:MUcrystal
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对多标签文本分类的概念歧义和底层语意结构问题,提出一种集成分类方法,将随机森林(RF)算法和隐性语义索引(LSI)有机结合在一起。通过词汇的随机分割增加集成的多样性,获得低维隐性语义空间的不同正交投影,在低维空间的正交投影基础上执行LSI。随机森林可以有效解决二进制分类问题,隐性语义揭示了文本的底层语义结构,两者结合可代表群体的多样性和个体准确性。Yahoo数据集上的实验结果验证了该方法的有效性,其在汉明损失、覆盖度、首位误差和平均精度方面优于其它方法。
其他文献
资料与方法    2008年5月~2009年5月收治住院患者15例,年龄55~76岁,脑卒中后10例,脑卒中并骨折2例,老年痴呆症3例。其中骶尾部10例,两侧髋部2例,足跟3例,压疮最小面积为2cmx3cm,最大面积为6cmx5cm。
关键词 肺心病 多器官损害    资料与方法  1997年10月~2005年2月收治肺心病晚期并发多器官损害的病例38例,男28例,女10例;年龄58~80岁,平均70.2岁;病程10~29年。均因感染出现呼吸衰竭加重而行所气管插管或切开,进行机械通气等综合治疗。  诊断标准,除符合呼吸衰竭的诊断标准,PaO250mmHg,同时具备以下1项和1项以上:肾衰竭,血肌酐(Cr)>177mmoL/L;心
摘 要 目的:探讨血清心肌肌钙蛋白TCTnT定量检测对慢性充血性心力衰竭CH患者的诊断价值。方法:采用用Roche金标技术定量免疫测试检测分析法定量检测血清CTnT。结果:冠心病中重度心衰组的CTnT比对照组、冠心病轻度心衰组非冠心病中重度心衰组CTnT明显升高P5。四组C-MB比较均无差异P>5。结论:血清CTnT定量检测对冠心病心衰患者心衰程度及中重度心衰患者的病因诊断有一定的价值。  关键词
目的:探讨抗生素致伪膜性小肠结肠炎危险因素及治疗,以便合理应用抗生素,而对伪膜性小肠结肠炎进行及时有效的治疗。方法:对160例肺炎病人,其中,80例应用克林霉素10天,伴有或不伴有
利用质构仪按照美国农业与生物工程师协会ASAE S368.4DEC2000(R2006)标准,结合大豆的生理结构特点,对2011年东北黑龙江产大豆样品分别从长(L),宽(W),高(H)对应的Z、Y、X三个
在我国经济新常态背景下,供给侧结构性改革是高职教育深化内涵建设,实现持续健康发展的必由之路。基于供给侧改革的视角,从制度供给、人才供给、要素供给三个维度剖析现阶段
近年来,我国科学家与临床医生联手,从分子水平揭示了黄连素降低血脂的奥妙。我们选择一组老年高脂血症患者进行临床观察,取得了显著效果。    资料与方法    2005年1月~2006年1月,选择门诊和住院老年血脂异常者37例,男27例,女10例;年龄65~76岁,平均69.2岁。诊断标准参照1996年全国血脂异常防治对策研究组制订的血脂异常防治建议[1]。总胆固醇(TC)>5.72mmol/L,甘油
为解决部分遮挡情况下车辆实时跟踪丢失的问题,提出一种基于特征点匹配的改进ORB(improved oriented FAST and rotated BRIEF)算法。在FAST检测角点后用拉普拉斯极值去除虚假角
针对灯光诱捕和取样检查都发现锈赤扁谷盗发生数量较多的储藏稻谷,实仓进行了补充施药控制偏高磷化氢浓度杀虫试验,试验仓房的气密性为500Pa正压半衰期为30s。试验结果为:在
对痹证的论述,早见于《内经》、《中藏经》,张仲景、孙思邈、李东垣、朱丹溪等医家均有论述。通常是指风寒湿(三气)之痹,还有五体(皮脉肉筋骨)之痹和五脏(心肝脾肺肾)之痹,以及胸痹、热