一种用户成长性画像的建模方法

来源 :山东大学学报(理学版) | 被引量 : 0次 | 上传用户:wangaijjuan860610
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户成长值反映用户粘性,预测用户成长值有助于实现精准营销。聚焦用户成长性画像研究,针对用户原始数据记录复杂多样、难以提取有效特征的问题,通过散点图分析挖掘影响用户成长值的因素,提取行为特征和相对稳定的时间特征,并对比基于树的特征筛选算法和L1范数进行特征筛选。针对已标注成长值的用户数据不足问题,改进COREG算法,通过半监督学习模型丰富训练数据,提高模型的预测准确度,同时降低原算法的时间复杂度,最后采用模型融合整合不同模型的优势。在CSDN博客平台提供的SMP CUP 2017数据集上进行实验,结果表明,建立的模型有效地提高了泛化能力和预测准确度。
其他文献
中国社会的进步,不以城市发展水平为标准,而是以农村富裕程度为底线,只有中国农民富了,中国才能真正进入发达国家的行列。同样的,中国流通现代化水平、中国统一市场的建立,不
期刊
2017年汛期,全路各单位严格执行汛期安全行车措施,确保了高铁和旅客安全,实现了连续第七个防洪安全年。从去年冬天开始,各铁路局汛前排查确定防洪重点地点1.5万多处,汛期根据排查情
采用自行搭建的脉冲热蒸发化学气相沉积(PSE-CVD)系统,制备了薄膜状的氧化亚铜样品。通过使用XRD、SEM和XPS三种检测手段分别从晶相鉴别、微观特征和元素构成的方面对沉积的
内部控制制度是推进高校财务治理能力现代化的重要手段,有效防控高校经济活动风险。本文从高校内部控制建设的必要性出发,通过对具有代表性的内控建设中的高校绩效预算管理分析
京广高铁北京至郑州段于2012年12月26日正式开通运营,并与此前已经开通运营的郑州至武汉段、武汉至广州段连接实现世界上运营里程最长的北京至广州高速铁路全线贯通。京广高铁
"女人像男人一样干活儿,男人像驴子一样干活儿"。这是当下零售业内的一句流行"戏语"。工作时间长,事务太琐碎,劳动强度大,工资不算高,还经常背负着"不公平采购"的指责。难怪
期刊
7月1日8时50分,两列动车组分别从太原南站、西安北站相向而行,太原至西安间的列车运行时间由原来的10小时缩短至3小时。以此为标志,大西高铁(太原南至西安北)正式开通运营,太原、西
<正> 用社会有限的投入,去实现对人类尽可能高的安全水准,在获得人类可接受的安全水平下,尽力去节约社会的安全投入,这是现代社会对安全科学技术提出的要求. 安全需要投入。
非物质文化遗产与人民的生产与生活有着密不可分的联系,其优势包含了促进就业和增加收入两个对于民生最重要的方面,是助力脱贫致富的主要方式之一。本文针对分析非物质文化遗产
2006年12月19日,当李永胜从农七师一三一团政委包建刚手中接过1000元奖金和由国务院第一次全国经济普查领导小组颁发的国家级先进个人荣誉证书时,激动地说:“真没