【摘 要】
:
Lasso方法与其他特征选择一样,对高维海量或高维小样本数据集的特征选择容易出现计算开销过大或过学习问题(过拟合)。为解决此问题,提出一种改进的Lasso方法:迭代式Lasso方法
论文部分内容阅读
Lasso方法与其他特征选择一样,对高维海量或高维小样本数据集的特征选择容易出现计算开销过大或过学习问题(过拟合)。为解决此问题,提出一种改进的Lasso方法:迭代式Lasso方法。迭代式Lasso方法首先将特征集分成K份,对第一份特征子集进行特征提取,将所得特征加入第二份,再对第二份特征进行特征提取;然后将所得特征加入第三份,依次迭代下去,直到第K份,得到最终特征子集。实验表明,迭代式Lasso方法能够很好地对高维海量或高维小样本数据集进行特征选择,是一种有效的特征选择方法。目前,此方法已经很好地应用在高维海量和高维小样本数据的分类或预测模型中。
其他文献
<正>城市供热一直是各地政府面临的难题之一。因为供热问题,政府常常陷入一对矛盾之中,即一方面供热企业不断要求追加财政补贴,而另一方面居民却因供热不佳年年投诉。症结到
以工业纯钛为密排六方金属的模型材料。通过多道次冷轧工艺制备具有不同位错界面类型的工业纯钛板材。利用分离式霍普金森压杆(SHPB)实现高速形变,采用透射电子显微分析技术
近年来随着我国社会主义市场经济的进一步发展和完善,企业财务工作越来越受到领导层的重视,财务工作质量的高低已经成为决定企业发展的命脉。因此,探讨和改进现金流量表的编
以沪深300指数的高频数据为例,运用滚动时间窗的样本外预测方法以及比SPA检验更具优势的模型信度设定检验(MCS),实证分析了跳跃、符号跳跃变差及符号正负向跳跃变差对HAR-RV
电力是维持人们日常生活的基本能源之一,电力配网则是新时期内电力系统的组成结构,对电力系统的正常运行具有重大的影响。因此在电力配电工程项目建设上,要采取综合性的措施
通过建立物联网的体系结构,详细分析了体系结构中感知层和处理层所面临的隐私安全威胁,对现有的与物联网技术相关的隐私保护方法进行了系统性的综述,重点讨论了匿名化方法、
目的建立高效液相色谱-荧光法(HPLC-FLD)测定马来酸氟吡汀的血药浓度,并使用该方法评价2种马来酸氟吡汀胶囊在健康人体的生物等效性。方法采用随机、开放、两周期交叉、单次
当前我国农村融资渠道狭窄,农户融资困难,制约了农民收入增长和农业现代化建设。近几年来,国家出台了一系列政策支持农村的土地承包经营权可以抵押,全国各地争相开展农村土地
目前,我国陶瓷行业在国际上取得了很大成就,陶瓷产量占全球产量的一半,出口量高达全球总交易的70%,但我国陶瓷产品的出口额度比较低,仅占世界的20%左右,所以在国际市场的竞争
针对深井油气层埋藏深、分散,井温高、封固段长等复杂情况,优选出了一种高温抗盐直角稠化水泥浆体系。该体系外加剂由高温降失水剂G301(或G306)、高温缓凝剂GH-Ⅱ(GH-ⅡB)和