基于高斯分布的改进词嵌入主题情感模型

来源 :计算机科学 | 被引量 : 0次 | 上传用户:tiantianle_a
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,主题情感联合模型成为了无监督学习领域的一项重要研究内容,在文本主题挖掘和情感分析等方面均有实际应用.然而,在现实场景中,微博因其文字短小、结构不完整等特征,给主题情感联合模型带来了一定的挑战.因此,围绕微博主题情感模型展开相关的研究与改进工作,目前较为流行的主题情感模型——TSMMF模型(Topic Sentiment Model Based on Multi-feature Fusion)中引入了词向量技术,运用多元高斯分布从词向量空间中快速采样邻近词语,并替换掉原Dirichlet多项式分布产生的单词,从而将共现频率低、信息量少的单词转变成突出主题、信息明确的单词,同时使用最近邻搜索算法来进一步提升模型处理大型微博语料库的运行速度,进而提出了GWE-TSMMF模型.对比实验结果表明,GWE-TSMMF模型的平均F1值约为0.718,相比原模型和现有的主流词嵌入主题情感模型(WS-TSWE模型和HST-SCW模型),其微博情感极性的分析效果均有显著提升.
其他文献
目前,基于深度学习的视频异常检测方法都是在单一视角下对视频片段中的异常行为或异常事物进行检测,忽视了视角信息在视频异常检测中的重要性.在单一视角下,当异常事物被遮挡或异常行为不明显时,现有算法的性能将难以得到保证.为此,文中首次将视角转换的概念引入到视频异常检测中,通过级联网络结构在多视角下进行异常判断来提升模型的鲁棒性.针对受限于数据集没有多视角的监督信息,难以实现真正的显式的视角转换问题,提出了一种基于隐式视角转换的视频异常检测方法.对初步检测结果为正常的目标帧,利用其与特定帧的光流信息,通过光流映射
常见的无监督特征选择方法考虑的只是选择具有判别性的特征,而忽略了特征的冗余性,并且没有考虑到小类问题,故而影响到分类性能.基于此背景,提出鲁棒不相关回归算法.首先,对不相关回归进行研究,使用不相关正交约束,以便找出不相关但具有判别性的特征,不相关约束使得数据结构保持在Stiefel流形中,使模型具有封闭解,避免了传统的岭回归模型引发的可能的平凡解.其次,损失函数与正则化项使用L2,1范数,保证模型的鲁棒性,得到具有稀疏性的投影矩阵;同时将小类问题考虑进去,使投影矩阵数量不受类别数的限制,得到足够多的投影矩
观测数据因果关系挖掘是很多学科的基础问题.然而基于约束与因果函数等的现有方法对数据的因果机制具有较强的假设,一般适用于低维数据,并不能很好地适用于存在隐变量的场景.为此,提出了一种基于信息瓶颈的因果关系挖掘方法,称为因果信息瓶颈方法.该方法将因果机制划分为压缩与提取两阶段,在压缩阶段,假设存在一个经过压缩的中间隐变量,在提取阶段,可能保留与结果变量相关的信息.在上述建模的基础上,通过推导其变分上界,设计了一种的基于变分自编码机的因果关系挖掘方法.实验结果表明,基于信息瓶颈的方法在合成数据中准确率提升了10
合作协同优化是目前针对大规模优化问题的最有前景的算法之一,该算法通过分而治之策略划分子问题,以进行协同进化.不同的子问题根据演化状态的不同对整体改善的贡献大小也不一致,因此均匀分配计算资源会造成浪费.针对上述问题,提出一种新颖的基于自适应资源分配池策略和基于竞争的群优化集成的竞争合作群协同优化算法.首先,考虑到子问题的不平衡性,将子问题对整体目标改善的动态贡献作为分配计算资源的标准;其次,为了更好地适应子问题演化状态,不固定资源分配单元,而是利用池模型进行自适应分配,并且在相同子问题连续迭代中避免重复评估
随着大数据时代的到来,各个行业领域需要处理的数据之间的关系数量呈几何级数增长,亟需一种支持海量复杂数据关系表示能力的数据模型,即领域知识图谱.虽然领域知识图谱展现了巨大的潜力,但不难发现目前仍然缺乏成熟的构建技术和平台.如何快速构建出领域知识图谱是一个重要挑战.在对领域知识图谱进行系统的研究后,提出了一种基于属性图模型的领域知识图谱构建方法.该方法对于存储在多种原始业务数据库中的结构化、半结构化数据,通过约定图数据库的数据对接协议、多种图实体模式和关系模式配置方案等方式,完成对应的高质量完整的图谱模式构建
如今,网络谣言、传染病、计算机病毒等负面影响力的传播,给社会稳定、人类健康和信息安全造成了巨大的隐患,识别它们的传播源,对于控制负面影响力造成的危害有着重要的意义.目前大多数方法都只致力于单个传播源的定位问题,而在实际网络中,负影响力往往来自多个传播源,而且需要进行传播过程的模拟;此外,由于忽略了顶点之间拓扑限制的差异,导致定位传播源的准确率不高而且需要大量的计算时间.针对这些问题,提出了一种基于极大似然的方法,利用少量观测点提供的信息来有效定位多个传播源.首先,提出了传播图的概念以及产生传播图的方法,根
空间众包用于解决带时空约束的线下众包任务,近几年得到了快速发展.任务调度是空间众包的重要研究方向,难点在于调度过程中任务和工作者的动态不确定性.为了高效地进行任务路径动态调度,提出了同时考虑任务和工作者的不确定性的空间众包任务路径动态调度方法,该方法进行了3方面的改进.首先,扩展了调度需要考虑的因素,除了考虑新增任务的时空属性不确定性之外,还考虑了新增工作者的交通方式和时空属性的不确定性.其次,对调度策略进行改进,通过使用聚合调度策略,对动态新增任务先进行聚合处理,随后再进行任务分配和路径优化,相比传统非
鲁棒性作为一种动态行为也是超网络领域的研究热点,对构建鲁棒网络具有重要的现实意义.尽管对超网络的研究越来越多,但对其动态研究相对较少,尤其是在神经影像领域.在现有的脑功能超网络研究中,大多是探究网络的静态拓扑属性,并没有相关研究对脑功能超网络的动力学特性——鲁棒性展开分析.针对这些问题,文中首先引入lasso,group lasso和sparse group lasso方法来求解稀疏线性回归模型以构建超网络;然后基于蓄意攻击中的节点度和节点介数攻击两种实验模型,利用全局效率和最大连通子图相对大小探究脑功能
基于方面情感分析(Aspect-Based Sentiment Analysis,ABSA)是自然语言处理的热门课题,其中意见目标抽取和意见目标情感极性分类是ABSA的基本子任务之一.而很少有研究直接抽取特定情感极性的意见目标,尤其是抽取更有潜在价值的消极情绪意见目标.文中提出了一种全新的ABSA子任务一抽取消极情绪意见目标(Negative-Emotion Opinion Target Ex-traction,NE-OTE),并提出了基于注意力机制和单词与字符混合嵌入的BiLSTM CRF模型(Atte
链路预测旨在利用可获得的网络拓扑信息预测未知的连接关系.基于路径联系的预测方法在无向网络中取得了较好的效果.然而,在有向网络下,相同长度的路径因路径中连边方向不同会造成节点连接强度不同,传统预测方法难以区分路径异构造成的差异.鉴于此,首先以边权矩阵量化各类有向边连接强度的差异,进而为节点间不同异构的多类路径计算其连接强度,然后区分同一长度路径下各类路径的作用大小,最后综合多阶不同长度路径贡献,提出了一种基于路径连接强度的有向网络链路预测方法.在9个真实网络数据集上进行了实验,结果表明,考虑路径连接强度差异