【摘 要】
:
提出了一种改进的K-NN (K Nearest Neighbor)与SVM (Support Vector Machine)相融合的文本分类算法.该算法利用文本聚类描述K-NN算法中文本类别的内部结构,用sigmoid函数对SV
【机 构】
:
哈尔滨工业大学计算机科学与技术学院
【基金项目】
:
国家自然科学基金,国家高技术研究发展计划(863计划)
论文部分内容阅读
提出了一种改进的K-NN (K Nearest Neighbor)与SVM (Support Vector Machine)相融合的文本分类算法.该算法利用文本聚类描述K-NN算法中文本类别的内部结构,用sigmoid函数对SVM输出结果进行概率转换,同时引入CLA(Classifier's Local Accuracy)技术进行分类可信度分析以实现两种算法的融合.实验表明该算法综合了K-NN与SVM在分类问题中的优势,既有效地降低了分类候选的数目,又相应地提高了文本分类的精度,具有较好的性能.
其他文献
我国电信改革和发展的成就举世瞩目,如何引导电信行业在新时期进一步健康发展,是政府监管部门和运营企业需要共同思考的问题.从安徽省的经济发展和通信发展现状来看,通信监管
征用农村集体土地补偿标准问题,在教学及实践中有很大争议。本文论述了集体土地征用行为、价格组成以及征地补偿中存在的问题,提出了引入市场机制的观点,借以引导学生对该问题的
目前、笔者在报上读到一篇文章题为《设斩“马谡》”文章写道:“马谡,言过其实、玩忽职守之徒也、近年来,经济领域“马谡”颇多,应痛斩之。”读了此文,觉得痛快、但总有一种
简要介绍桥梁转体法的发展概况、水平转体法的原理、分类和适用条件,以及适合我国国情的平转施工方法。
自1997年贝尔实验室提出软交换概念以来,很快便得到了业界的广泛认同和重视,在短短的几年中,软交换的发展已经经历了三个阶段:实验室阶段、市场推广阶段、大规模应用阶段.在
在二滩双曲拱坝设计过程中,对拱坝体形优化、坝体断面设计、坝体强度与坝肩稳定设计准则等一些关键技术问题进行了深入研究,其设计思想、设计方法和设计原则借鉴国家“七五”“
小湾水电站是澜沧江中下游河段8个梯级中的龙头工程,地处高山峡谷,地质条件较复杂又属高地震烈度区;双曲拱坝高292m,是当今拟建拱坝世界之最;泄洪总功率46000MW,泄洪消能问题突出且难度大;地下厂
通过对拱坝非线性开裂问题的研究提出了拱坝非线性分载位移法的计算模型,推导了非线性状态下,拱坝截面内力与曲率关系的公式。确定了拱坝开裂分析中混凝土破坏条件。拱坝非线性
研究了采用TDMA接入方式的无线分组网络上行信道时隙分配策略,基于移动台的QoS要求,提出了一种自适应时隙分配算法.利用服务曲线对移动台的QoS要求进行了建模.算法的目标是在