基于深度强化学习的时序推特流文本分类方法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:sxsdlyq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推特是社交网络中典型的代表。一般来说,推特文本相比于与传统的新闻报纸、杂志期刊、网络博客等数据具有体量大、篇章短小、实时性高、覆盖面广和噪声多等特点。这些特点给推文信息的高效获取带来了很大困扰,大部分用户往往没有时间逐条浏览每一条信息。如何对推文信息进行及时降噪处理、抽取有价值的信息正在成为自然语言处理领域的一个热门话题。本文提出了一个基于深度强化学习的时序推特流文本分类算法DQN-TC(Deep Q-Network for Text Classification),该算法是深度神经网络和强化学习的结合。强化学习具有非常强大的自主学习能力,其中Agent根据当前的状态通过尝试不同的动作来从环境中获得最大期望反馈值,然后执行该动作来更新当前的状态。在强化学习的经验回放过程中,模型将当前时刻的输入作为Agent的状态,这个状态在本文中是推特文本的向量表示,然后下一时刻的推特文本向量表示作为观察到的状态。模型的另一个创新点在于使用了由循环神经网络和全连接层组成的深度神经网络架构作为动作价值函数的估计函数。其中,循环神经网络是将推特流文本蕴含的时间序列信息和语义信息作为网络的输入,然后生成输入序列的高维抽象表示,最后经过全连接层输出相应动作的Q值,得到的这个值用来估计强化学习中的动作价值函数,以便确定下一步需要采取哪种动作,即是否过滤该推特文本。本文爬取了真实的TREC 2016实时摘要数据集,经过对爬取的原始推特文本进行彻底的清洗,生成了文本的向量表示。然后进行了一系列的实验来评估提出模型的有效性,从简单常用的夹角余弦值相似度计算到基于SVM的分类算法的分析,说明了常规的机器学习算法抽取文本特征来进行模型的训练并不能取得理想的效果。然后本文基于推特流文本的时间序列信息采用了基于LSTM模型的算法,获得了比基于SVM模型更优的效果。最后本文在前边几个算法的基础上,使用基于Deep Q-Network(DQN)的算法得到了具有说服力的实验结果,最后验证了本文所提出算法DQN-TC的有效性。
其他文献
随着科学技术的发展和碎片化传播环境的形成,快速发展的短视频逐渐取代传统媒介成为了制造景观的新 场所。本文以李子柒为例,从凯尔纳的“媒体奇观”这一理论入手,试图从李子
随着电视媒体行业不断发展,电视摄像水平和艺术效果呈现出逐步提升的状态。这就应强化电视摄像艺术 表达研究力度,使得电视摄像艺术水平和现实价值有所提升。本文就电视摄像
目的 探索一种易于标准化的亲子鉴定方法。方法 选用九个群体家系资料明确的四核苷酸重复的STR位点 ,用荧光标记物标记引物、PCR复合扩增、灵敏度更高的 3 77测序仪对 45例
2005年7月28日,杭州湾跨海大桥首片50米箱梁架梁成功! 这一架,开创了桥梁建设中“梁上架梁”新纪录,在世界公路桥梁建筑史上翻开了崭新的一页。11月27日,50米箱梁制架实现了
2007年12月18日,中国和平利用军工技术协会2007年常务理事会在北京召开。中国和平利用军工技术协会理事长于宗林主持会议,秘书长石金武在会上做2007年工作报告及2008年工作展望
目前技能大赛在我国高校中得到了普遍推广,因此怎样将职业技能大赛和教学完美地结合起来成为各大高校思考的重要问题。文章对高校物流人才的培养现状进行了分析,并探讨了“赛
电力营销稽查管理在电力企业发展过程中发挥着重要作用。电力营销稽查工作是我国电力系统管理的重要 组成部分,也是维护电力企业平稳运行的重要管理手段之一。随着市场化进程
文章在界定信息产业创新的内涵与内容的基础上,构建评价信息产业创新能力的指标体系,通过对湖北省2003年、2005年、2008年相关指标的模糊层次综合评价,分析湖北省信息产业在
今年的预期目标是:全年工业增加值和工业产品销售收入分别增长16%和15%;确保按计划完成武器装备科研生产任务;军工集团公司实现利润增长10%以上,工业经济效益综合指数提高8个百分点,
针对目前变电站运维人员劳动强度大、运维管理模式落后等问题,提出利用终端机实现变电站工作票的全过程管理。该终端机采用OCR自动识别技术,可以实现工作票的智能识别、智能