【摘 要】
:
以正例(P)和未标识实例集(U)训练分类器的文本分类算法(PU文本分类)是解决某些机器学习中训练样本获取代价过大、尤其是反例样本较难获取的实际问题。而传统的分类算法大都需要正例和反例数据集才能取得良好的效果,因此要使用传统的分类方法来解决面向PU的分类问题,U集中可信反例的提取是分类器能够取得良好效果的关键.提出了有效的可信反例提取算法(基于聚类的可信反例提取算法)——CBRN,并对已有的PU文本
【机 构】
:
吉林大学计算机科学与技术学院 长春 130012 沈阳炮兵学院 沈阳 110162 吉林大学计算机
【出 处】
:
第二十五届中国数据库学术会议(NDBC2008)
论文部分内容阅读
以正例(P)和未标识实例集(U)训练分类器的文本分类算法(PU文本分类)是解决某些机器学习中训练样本获取代价过大、尤其是反例样本较难获取的实际问题。而传统的分类算法大都需要正例和反例数据集才能取得良好的效果,因此要使用传统的分类方法来解决面向PU的分类问题,U集中可信反例的提取是分类器能够取得良好效果的关键.提出了有效的可信反例提取算法(基于聚类的可信反例提取算法)——CBRN,并对已有的PU文本分类算法进行了改进,并提出了SPY-SVM算法。实验表明,该方法比目前其他的面向PU的文本分类方法具有更高的准确率和召回率。
其他文献
本文利用离散时间动力系统一致稳定和一致渐近稳定的用K函数表示的等价定理,以及用KL函数刻画的一致渐近稳定判定定理及其逆定理讨论了摄动离散时间系统的稳定性结论,从而对于离散时间动力系统的扰动分析和相应控制问题奠定了严格的理论基础.
本文研究了参数未知的线性系统在通讯限制下的镇定问题,在对未知参数集合是能控紧集的假设下,我们证明能否存在一种机制使得控制器能自适应的镇定被控系统完全取决于连接这两者的通讯信道的平均传输率,而这个平均传输率仅仅依赖于未知真实系统的不稳定振型,并且与参数已知时系统被镇定所需的相应传输率完全一换致.
本文研究的问题是汽车发动机测试台力矩H-inf控制.利用对各个控制性能指标加权的H-inf控制方案,成功的解决了已有的控制器在实际应用中存在的闭环系统带宽过窄,相位滞后过大,执行器饱和,鲁棒性能不足以及系统响应指标中等问题.实验结果显示,H-inf控制的确是解决该问题的最佳选择之一.
在控制系统中需要获得采样信号用于系统的模型辨识或实时控制,而这些采样信号将不可避免的受到噪声的污染,使得系统控制精度得不到提高.小波变换的方法可以降低电机控制系统中的噪声影响,通过变换分解出高频噪声部分,利用小波收缩的阈值量化方法去掉高频部分,再重构信号从而达到去噪目的.通过实验总结出小波变换结合软阈值处理法在信号重构及去噪效果方面都是最优的.
本文针对系统输入更新周期为T,输出采样周期为nT的多速率系统,提出一种带有模型不确定性的多速率预测控制算法.它采用区间形式来定义模型参数的不确定性,通过对性能指标中的预测输出不确定性和跟踪误差的加权最小化,来设计预测控制器.在多速率的处理上,利用对两个输出采样点之间的n-1个预测输出值进行估计,来解决由于多速率引起的因果约束.仿真结果证明了算法的有效性.
本文根据实际的简化模型,建立了地层环境温度控制系统状态空间模型,在此基础上提出了基于开关量的多变量约束预测控制算法并将其应用到地层环境温度控制系统中,实际应用表明显示出了该算法的优良性能.
本文引入了利用时间序列的延时重构,然后采用延时方差及替代数据的时间序列非线性的检验方法,并将该方法应用于设备故障信号的非线性检验.通过数值实验及与传统方法对比结果表明,延时矢量法是一种有效、直观的非线性检验方法,对噪声信号具有很强的鲁棒性,而对非线性信号具有很高的敏感性.采用该方法对设备振动信号进行非线性检验,检验结果与实际情况相符.
本文首次给出了带有观测时滞的广义系统的稳态最优估值器.首先引入观测重组序列,给出了一种不需要状态增广即可处理带有观测时滞系统的方法,通过广义系统的标准分解得到最优估值器.进一步出于简化计算的考虑,给出稳态最优估值器.
本文研究了复参数最小二乘估计方法,提出了一种加权遗忘因子的复参数最小二乘估计方法(WFCRLS).通过对逆变器输出信号的分析变换获得信号的数学模型,利用WFCRLS实现了逆变器输出信号的谱估计,仿真结果表明本文方法的有效性.
随着网络应用的多样化,不响应流占据了相当比例,这些不响应流在原有的队列管理机制下将会获得较大带宽.总结了各种已有队列管理机制的不足,针对不响应流的特征提出了一种新的路由器拥塞控制选择性丢弃策略.在满足低带宽流需求的基础上,使响应流和不响应流可以公平地分享带宽.最后利用网络仿真软件对新的算法和其它几种算法进行了比较,说明了新算法能够明显提高公平性,并有较好的扩展性和适应性.