【摘 要】
:
We experimentally compare the performance of Multiple Criteria Linear Programming(MCLP) and Linear Discriminant Analysis(LDA)classification algorithms by implementing bias-variance decomposition. Unde
【机 构】
:
Research Center on Fictitious Economy & Data Sciences, Chinese Academy of Sciences, 100080 School of
【出 处】
:
首都经贸大学,中央财经大学,西南财经大学,淡江大学
论文部分内容阅读
We experimentally compare the performance of Multiple Criteria Linear Programming(MCLP) and Linear Discriminant Analysis(LDA)classification algorithms by implementing bias-variance decomposition. Under Domingos bias-variance decomposition framework,by using bagging ensemble,we compared their bias,variance and their variations with the size of training set on three data sets. We aimed to comparing their classification accuracy,diversity and other main characteristics. The experimental results show that,MCLP and LDA are all simple and effective classification algorithms. When training set is large enough,they present almost the same good performance.But they still behave differently in some aspects. LDA is more stable than MCLP while MCLP is more suitable for large training sets. IN their own bias-variance structures,LDA presents high bias and low variance while MCLP has the oppositional characteristics to LDA.
其他文献
中国迈向强国之路的挑战,包括处理复杂但不友善的国际关系、调节盘根错节的国内利益,以及维持生态环境和社会的稳定发展。为此,最高领导人胡锦涛提出两项指导原则—和谐社会和科学发展观,意图调整国家发展的方向和速度,要从偏重经济成长政策,转向同等重视经济发展和社会公平与正义。相关政策包括加强环境保护、实施九年免费义务教育、以及有步骤地推动全民医疗、最低生活保障和失业退休等保险制度。另外,还强化了对劳动、投资
从节能减排目标出发,利用1985-2005年相关统计数据,分析了近20年来山东省工业生产能源消耗和SO2 排放量的绿色距离和生态化实现程度的动态变化,得出了在总体上向好的方向发展的结论。利用2005年截面数据,对37个工业部门进行节能减排的分类研究,并将37个工业部门划分为3 种类型,即低能耗-低污染工业、中能耗-中污染工业和高能耗-高污染工业。然后,对上述3类工业2001-2005年的能源消耗和
本文总结性地论述了经济学的“手”的理论。从理论上论述了“看不见的右手”(市场)、“看得见的左手”(政府)、“看得见的右手”(企业)和“看不见的左手”(权力及利益集团)的功能及其缺陷,认为,要达到资源的优化配置和社会和谐,各只“手”必须各司其职,发挥其长处、规避其缺陷,并处理好“四只手”之间的比例、结构和均衡状态。同时,认为中国的改革契合了经济学的“手”的理论,并总结了中国改革的经验,即:(一)、制
Semiparametric reproductive dispersion nonlinear model(SEDNM)is an extension of reproductive dispersion nonlinear model and semiparametric regression model,and includes semiparametric nonlinear model
寻找统计分布中参数的最短置信区间长度往往讨论具体分布中参数的最短置信区间长度.本文从常用枢轴变量的形式即对数的线性函数形式和反比例函数形式出发,可以获得得到参数量短置信区间长度的两个条件,并且枢轴变量的密度函数满足一定条件时,最短置信区间长度是存在且唯一的,结论具有一般性.
The purpose of CPM(Critical Path Method)is to identify critical activities on the critical path of activity networks. Activity networks are used for performance evaluation of certain types of projects
With the improvement of quality of software,software reliability becomes more and more important,this paper analyzes the limitation and shortcomings in the current modcls of software reliability and u
In biological and ecological statistical inference,it is practically useful to provide a lower bound for species richness. Chao(1984. 1989) derived a non-paramctric lower bound for species richness in
对损失分布进行统计推断是保险学中的一个重要课题.本文采用分层逐步展开的方式,对损失分布的拟合方法及拟合过程中的注意事项进行了具体说尽的阐述,并指出,当有多个理论分布可供选择时并都満足拟合优度检验时,可进一步通进最小二乘原理来检验,得到更合拟合分布.
在肯塔基州,乳癌爲第二顺位导致女性癌证死亡的主因,但是未有任何空间分析研究的文献发表,所以本文期盼透过集群分析云探讨不同的区域特徵与在各区域上的乳癌发生率之间的相互关系,以明确的了解影乡区域乳癌发生之并异的相关因子,进而对乳癌的发生或死亡加以有效的预防.本文中主要探诗的四大类型区域特徵:人口组成、社会资本、环境污染及城乡差异。经由SaTScan中常态模型云比较乳癌发生率在调整各区域特徵前後之空间群