【摘 要】
:
在交互式网络电视(IPTV)应用中,家庭电视终端往往由多名家庭成员共用,现有推荐算法难以从终端历史数据中分析出家庭成员的不同兴趣偏好.为了满足同一终端下不同成员的视频点播需求,提出了一种基于胶囊网络的IPTV视频点播推荐模型CapIPTV.首先,设计了一种基于胶囊网络路由机制的用户兴趣生成层,将终端历史行为数据作为输入,并通过胶囊网络的聚类特性得到不同家庭成员的兴趣表达;其次,利用注意力机制给不同的兴趣表达动态分配注意力权重;最后,提取出不同家庭成员的兴趣向量和点播视频的表示向量,计算两者内积后得出Top
【机 构】
:
电子科技大学信息与软件工程学院,成都610054
论文部分内容阅读
在交互式网络电视(IPTV)应用中,家庭电视终端往往由多名家庭成员共用,现有推荐算法难以从终端历史数据中分析出家庭成员的不同兴趣偏好.为了满足同一终端下不同成员的视频点播需求,提出了一种基于胶囊网络的IPTV视频点播推荐模型CapIPTV.首先,设计了一种基于胶囊网络路由机制的用户兴趣生成层,将终端历史行为数据作为输入,并通过胶囊网络的聚类特性得到不同家庭成员的兴趣表达;其次,利用注意力机制给不同的兴趣表达动态分配注意力权重;最后,提取出不同家庭成员的兴趣向量和点播视频的表示向量,计算两者内积后得出Top-N偏好推荐.在公开数据集MovieLens和真实广电数据集IPTV上的实验结果表明,CapIPTV的命中率(HR)、召回率(Recall)和归一化折损累计增益(DNCG)优于其他五种同类推荐模型.
其他文献
针对标准人工蜂群(ABC)算法存在开发能力弱、收敛速度慢的缺点,提出了一种基于多种群组合策略的ABC算法.首先,将异维协同和多维匹配的更新机制引入搜索方程;然后,针对雇佣蜂和跟随蜂分别设计了两种组合策略,组合策略是由侧重于广度探索和深度开发的两个子策略构成.在跟随蜂阶段,将种群划分为自由子集和非自由子集,并使属于不同子集的个体采用不同的子策略,从而平衡算法的探索与开发能力.通过15个标准测试函数将所提改进ABC算法与标准ABC算法和其他3种改进ABC算法进行仿真对比,结果表明所提算法在低维和高维问题中都具
针对多分类支持向量机(MSVM)对噪声较强的敏感性、对重采样数据的不稳定性以及泛化性能低等缺陷,将pinball损失函数、样本模糊隶属度以及样本结构信息引入到简化的多分类支持向量机(SimMSVM)算法中,构建了基于pinball损失的结构模糊多分类支持向量机算法Pin-SFSimMSVM.在人工数据集、UCI数据集以及添加不同比例噪声的UCI数据集上的实验结果显示:所提出的Pin-SFSimMSVM算法与SimMSVM算法相比,准确率均提升了0~5.25个百分点;所提出的算法不仅具有避免多类数据存在不可
从姿态信息采集、姿态情绪特征提取、姿态情绪识别算法和姿态情绪数据库几个方面对国内外姿态情绪识别研究进行了全面的总结,分析了姿态情绪识别研究存在的难点和挑战,提出姿态情绪识别的关键是姿态情绪特征提取和姿态情绪数据库的建立,最后探讨了姿态情绪识别研究的发展方向.
随着社交网络的发展,对其包含的海量文本进行情感分析具有重要的社会价值.不同于普通文本分类,短文本情感分类需要挖掘隐含的情感语义特征,具有极大的难度和挑战性.为了能在更高的层次上得到短文本的情感语义特征,提出了一种多头注意力记忆网络(MAMN)用于短文本情感分类.首先,利用n元语法特征信息和有序神经元长短时记忆(ON-LSTM)网络对多头自注意力机制进行改进,以对文本上下文内联关系进行充分提取,使模型可以获得更丰富的文本特征信息.然后,利用多头注意力机制对多跳记忆网络的结构进行优化,使得在拓展模型深度的同时
微博作为人们获取和传播新闻事件的主要平台,隐藏着丰富的事件信息.从微博数据中抽取故事线能为用户提供一种直观的方式来准确理解事件演化,然而微博数据稀疏和上下文缺乏的特点为故事线抽取带来了挑战.因此,通过两个连续的任务从微博数据中自动抽取故事线:1)基于微博传播影响力对事件进行建模,并提取出首要事件;2)基于事件特征建立异构事件图,提出事件图卷积网络(E-GCN)模型来提升对事件间隐式关系的学习能力,从而实现事件的故事分支预测并链接事件.在真实数据集上从故事分支和故事线两个角度进行评测,结果表明所提方法在故事
针对低资源语言机器翻译任务上一直存在的标注数据资源匮乏问题,提出了基于语种相似性挖掘的神经机器翻译语料库扩充方法.首先,将维吾尔语和哈萨克语作为相似语言对并将其语料进行混合;然后,对混合后的语料分别进行字节对编码(BPE)处理、音节切分处理以及基于音节切分的BPE处理,从而深度挖掘哈语和维语的相似性;最后,引入“开始-中部-结束(BME)”序列标注方法对语料中已切分完成的音节进行标注,以消除音节输入所带来的一些歧义.在CWMT2015维汉平行语料和哈汉平行语料上的实验结果表明,所提方法相较于不进行特殊语料
域自适应的目的是利用有标记(源)域中的信息来提高未标记(目标)域模型的分类性能,且这种方法已经取得了不错的成果.然而在具有开放性的现实场景下,目标域通常包含源域中未观察到的未知类样本,这被称为开放集域自适应问题.传统的域自适应算法对这样具有挑战性的场景设定无能为力,因此提出了渐进式分离的开放集模糊域自适应算法.首先,基于引进隶属度的开放集模糊域自适应算法,探索了逐步分离目标域中已知类和未知类样本的方法;然后,仅将从目标域中分离出的已知类与源域对齐,从而减小两个域之间的分布差异,进行模糊域自适应.所提算法很
很多传统社区检测方法大多局限于单关系网络,适用性和准确性均较弱.针对此问题,提出了一种针对多关系网络的社区检测方法.首先,为进行多关系网络建模,使用了三阶邻接张量,其中张量的每个切片表示与参与者之间一种类型的关系相对应的邻接矩阵.从数据表示的角度,将多关系网络解读为三阶张量利于将因子分解方法作为学习方法使用.然后,应用RESCAL分解作为关系学习的工具,从而揭示参与者的唯一隐性表征.最后,在上一步得到的结果上应用进化K均值聚类算法,以确定多维度上的社区结构.在一个合成数据集和两个公开数据集上进行实验.实验
文本特征是自然语言处理中的关键部分.针对目前文本特征的高维性和稀疏性问题,提出了一种基于Word2Vec词嵌入和高维生物基因选择遗传算法(GARBO)的文本特征选择方法,从而便于后续文本分类任务.首先,优化数据输入形式,使用Word2Vec词嵌入方法将文本转变成类似基因表示的词向量;然后,将高维词向量模拟基因表达方式进行迭代进化;最后,使用随机森林分类器对特征选择后的文本进行分类.使用中文评论数据集对所提出的方法进行实验,实验结果表明了优化后的GARBO特征选择方法在文本特征选择上的有效性,该方法成功地将
针对当前主流神经网络在处理答案选择任务时无法同时满足句子的充分表示以及句子间信息充分交互的问题,提出了基于动态注意力和多角度匹配(DAMPM)的答案选择模型.首先,调用预训练语言模型的嵌入(ELMo)获得包含简单语义信息的词向量;接着,在注意力层采用过滤机制有效地去除句子中的噪声,从而更好地得到问句和答案句的句子表征;其次,在匹配层同时引入多种匹配策略来完成句子向量之间的信息交互;然后,利用双向长短期记忆(BiLSTM)网络对匹配层输出的句子向量进行拼接;最后,通过分类器来计算拼接向量的相似度大小,从而得