【摘 要】
:
新闻的发展呈现动态变化的特征,其生命周期一般比较短。一篇新闻要想受到大家的欢迎,即成为热点新闻,它必须能够在相对较短的时间内传播给大量的读者,并且它的部分特征属性必
论文部分内容阅读
新闻的发展呈现动态变化的特征,其生命周期一般比较短。一篇新闻要想受到大家的欢迎,即成为热点新闻,它必须能够在相对较短的时间内传播给大量的读者,并且它的部分特征属性必须满足大部分用户的兴趣爱好,能勾起用户的阅读欲望。因此,取并研究这些决定在线新闻受欢迎程度的特征属性,分析其相互关系,并最终建立模型来述新闻受欢迎程度与这些特征属性的关系就显得尤为重要。本文选取了新闻的47个特征维度,出预测新闻是否受欢迎的二分类问题。分析过程主要包括以下几步:数据预处理、述性分析、建立模型、模型评价、得出结论。其中建立模型部分,选择了逻辑回归、CART决策树、随机森林和XGBoost。其中逻辑回归中对于变量存在相关性的情况,采取了在目标函数上加入惩罚项的方法消除多重共线性。尝试了L1和L2正则项,L1的效果更好。模型参数设置方面,用到了10折交叉验证来确定最优参数,特别的,XGBoost的参数设置还采用了网格搜索法Grid Search CV。模型评价方面,采用了准确率、查准率、查全率、F1、AUC指标,综合评价了所有模型,得出XGBoost的预测效果最好。最后得出了高新闻受欢迎程度的对策。
其他文献
背景苯硫酚是一种重要的有机合成添加剂,已被广泛应用于农药、医药和功能高分子的合成。它的毒性很强,吸入或摄入苯硫酚会引起严重的健康问题而引起广泛地关注。荧光检测法因其具有较高的灵敏度、较低的检测限、低毒副作用甚至可实现原位、实时、可视化智能化分析的特点而被广泛应用于生命科学、法医学、环境科学等多学科领域中离子、分子乃至生物大分子的检测。因而开发新型苯硫酚荧光探针在环境检测和法医鉴定中具有重要意义。目
飞机主动驾驶侧杆系统(Active Side-stick System,ASS)是飞行员驾驶飞机的操纵装置和操纵指令输入器,是飞机的关键机载产品,其可靠性和控制性能直接影响飞机的安全性和操控品
目的:比较前路减压融合术(anterior decompression with fusion,ADF)和后路单开门椎板成形术(posterior open-door laminoplasty,LAMP)治疗脊髓线(spinal cord line,SC线)Ⅱ型多节段脊髓型颈椎病(multilevel cervical spondylotic myelopathy,MCSM)的临床及影像学结果。方
行人再识别是指在跨摄像头区域下的行人目标检索问题。随着监控设施覆盖范围的不断增大,监控数据不断增多,行人再识别给公安机关提供了便捷的目标检索和身份认证方案。由于数据量的增大以及在图像拍摄过程中所受到的各类因素影响,使得在不同监控摄像头下的行人再识别任务面临巨大挑战,如何在复杂干扰条件下提取具有判别力的行人特征,如何采用合适的相似性度量方法提高再识别准确率,这两个问题是目前行人再识别任务的研究难点。
我国土石坝数量大且溃坝占比高,其中由于坝体渗漏和漫顶导致的溃坝案例占比极高,随着经济社会的不断发展,人们越加不能承受溃坝带来的严重后果。基于此,本文旨在对我国土石坝
为了更好地落实立德树人的根本任务,新版《普通高中思想政治课程标准》提出了学科核心素养即政治认同、科学精神,法治意识,公共参与,而培育学生政治认同素养则是落实四个学科
《国家中长期教育改革和发展规划纲要(2010-2020年)》指出:教育需要着力提高学生服务国家和人民的社会责任感、勇于探索的创新精神和善于解决问题的实践能力.这就在纲领文件的层面上明确了培养与提高学生数学实践应用能力的重要性和必要性,也使得培养与提高学生数学实践应用能力成为了数学教育教学必须直面与重视的问题.教育实践表明,数学实践应用能力的培养与提高和数学学习的全过程都是相伴相随的.初中数学,作为
随着用户终端的迅速增长和各种业务数据量的急剧增大,人们对无线光通信系统的容量和传输速率提出了更高的要求。多输入多输出(Multiple-Input Multiple-Output,MIMO)技术通过使用多个发射机同时向接收器发送数据提高了系统的容量和可靠性,但同时也存在信道间干扰强、子信道间同步要求高等问题。空间调制(Spatial Modulation,SM)作为MIMO传输技术的一种,将二维映
DC-DC变换器作为现代电力电子系统的核心之一,具有重要的工程应用价值,它们的正常运行对保证整个系统的稳定、高效、优质运行意义重大。随着电子技术的高频化和集成化发展,高
随着智能制造技术的不断发展,控制系统在将新一代传感和信息技术有机融合的过程中,其复杂化、智能化程度也不断提高,这为系统寿命预测与健康维护(Prognostic and Health Management,PHM)在新技术背景下赋予了新内涵。系统的安全性、耐用性、可靠性受到空前的高度重视,其性能和相关设备的安全管理已然成为企业关注的焦点。尽管目前对单一元部件或设备的PHM技术已有了不少的成果,但反馈