【摘 要】
:
在多标签分类问题中,特征选择是提升多标签分类器性能的一种重要手段.针对目前多标签特征选择算法计算复杂度大和无法给出一个合理的特征子集的问题,提出了一种基于信息熵的
论文部分内容阅读
在多标签分类问题中,特征选择是提升多标签分类器性能的一种重要手段.针对目前多标签特征选择算法计算复杂度大和无法给出一个合理的特征子集的问题,提出了一种基于信息熵的多标签特征选择算法.该算法假设特征之间相互独立,使用特征与标签集合之间的信息增益来衡量特征与标签集合之间的重要程度,并据此提出一种信息增益阈值选择方法.首先计算每一个特征与标签集合之间的信息增益,然后使用信息增益阈值选择算法得到一个合理的阈值,最后根据阈值删除不相关的特征,得到一组合理的特征子集.在2个不同分类器和4个多标签数据集上的实验结果表明:特征选择算法能够有效地提升多标签分类器的分类性能.
其他文献
葡萄是一种分布广、寿命长、结果早、营养丰富、用途广泛、经济价值高的果蔬。汤原农场通过近几年的栽培和管理形成了一套成熟的栽培技术模型。作者通过对农场在设施葡萄上的
目前世界范围内除了印度对尿素有一定需求外,其他地区一片沉寂。据悉,近日印度从独联体采购的50万t尿素价格再次走低,为770美元左右。由于需求很少,价格有进一步下滑的可能。海运
面对着经济建设的飞速发展,汽车燃料问题成为最大的发展瓶颈,故而推广使用车用乙醇汽油是大势所趋。本文阐述了车用乙醇汽油对我国的能源替代有着广阔的发展前景;同时,指出推广使
本研究是通过对炼油厂延迟焦化原料油和乙烯裂解焦汕不同掺炼比例混合原料进行分析,结合炼油厂延迟焦化装置设计建造自动控制延迟焦化实验装置。在延迟焦化实验装置进行不同掺
三维集成电路(three dimensional integrated circuit,3DIC)和片上网络(network on chip,NoC)是集成电路设计发展的两个趋势.将两者结合的三维片上网络(three dimensional network
随着硬件复杂度的不断提高和并行软件调试的需求不断增长,可调试性设计已经成为集成电路设计中的重要内容.一方面,仅靠传统的硅前验证已经无法保证现代超大规模复杂集成电路
作为我国的高原地区之一,贵州以其险峻的山区地势成为了魔芋的主产区,往往在确保魔芋产量的同时还能保证较高的质量。贵州省毕节市威宁县的山区气候宜人,种植条件良好,是播种
对森林资源的有效管理,可以使森林资源得到有效地保护,进一步推动林业产业的全面可持续发展,将林业自身的经济作用与生态价值充分地发挥出来。基于此,文章将森林资源管理作为
商务部2006年12月26日发布2006年第103号公告,公告称,2005年12月29日商务部发布公告,决定对原产于印度和台湾地区的进口壬基酚进行反倾销调查。该被调查产品归在《中华人民共和
2007年2月8日,美国业界向美国国际贸易委员会提交申请,要求对原产于中国的六偏磷酸钠(Sodium Hexametaphosphate)启动反倾销调查程序。