【摘 要】
:
将文本之间存在的时序关联性元信息和文档的标签信息,引入到隐藏Dirichlet分配模型中,提出一种在线增量标签主题(on-line labeled incremental topic model,OLT)模型.首先,在
【机 构】
:
闽南师范大学计算机学院,吉林大学计算机科学与技术学院
【基金项目】
:
国家自然科学基金(批准号:60373099;60973040;61303131);福建省高校杰出青年科研人才培育计划项目(批准号:JA13196)
论文部分内容阅读
将文本之间存在的时序关联性元信息和文档的标签信息,引入到隐藏Dirichlet分配模型中,提出一种在线增量标签主题(on-line labeled incremental topic model,OLT)模型.首先,在线增量标签主题模型优化了文本标签元信息与主题之间的映射关系;其次,利用动态字典增加了模型与文本的拟合程度.该模型优化了先验分布超参数迁移计算的连续性,解决了隐藏Dirichlet分配(LDA)模型不能利用文本属性与主题之间的相关性进行主题发现及演变分析的问题.实验结果表明,所提出的在线增量标签主题模型能显著改善多标签判别精度,提高模型的泛化能力并提升模型的运行性能.
其他文献
目的通过观察关节松动术治疗偏瘫后肩手综合征(RSD)的疗效,并对其原理进行分析探讨。方法脑卒中偏瘫患者38例,均出现肩痛等症状,符合RSD诊断,所有患者随机分为2组,每组19例,
以 3 羟基 2 烷基 4 (1H) 吡喃酮为原料与胺反应制备N 取代 4 (1H) 吡啶酮 ,再与亲核试剂发生氧化 -迈克尔加成反应 ,合成了相应的N 取代 6 芳硫基吡啶酮化合物 .生物
上世纪七十年代,二语习得理论诞生于美国,很快该理论便普及到世界的外语教学范围领域内,为外语教学提供了巨大的裨益。通过对二语习得理论的运用,可以有效的提升大学生的外语
目的了解半乳糖苷凝集素-7(galectin-7)对不同T细胞亚群增殖的影响,并进一步探讨其免疫治疗方面的应用前景。方法利用不同浓度的重组Galectin-7蛋白在有或无抗CD3和CD28抗体
<正>英语阅读作为语言技能的重要组成部分,作为语言输入的主要环节之一,在英语教学中占有重要地位。培养学生的阅读能力是主要教学目标之一,而在平时的教学过程中,我们会发现
借助新的电信时代的特点,米勒提出了"文学终结"思想,这一结论只是理论上的一种想象,因为民族文学永远无法解构的事实颠覆着这一结论。米勒的思考存在着逻辑悖论,米勒"终结"的
应用C/S及B/S混合软件体系结构技术,通过病例文本、医学影像、音频听诊等模拟临床全科医学病例,对学生进行临床综合能力的测试和评价,该系统已应用于我院的临床医学(全科)专业毕业考
随着临海柑桔知名度的提高,近几年柑桔发展较快,山地柑桔开发猛增,东塍镇在山地柑桔开发过程中,出现一些盲目开发的状况,针对山地柑桔开发存在的一些问题,对做好建园规划、改
随着我国经济飞速发展,公立医院医疗服务价格的改革已成为一种必然趋势。然而目前医疗服务价格改革机制存在着较为明显的问题,一方面不能很好的满足当前人们对医疗服务越来越