用于多标签分类的改进Labeled LDA模型

来源 :南京大学学报:自然科学版 | 被引量 : 0次 | 上传用户:sashiu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
概率主题模型由于其优良的文档分析能力,被广泛应用于各种文本分析任务中.然而,网络中的文档数据除了含有基本的内容信息外,同时还可能存在文档类别、作者等信息.如何通过主题模型对这些信息进行有效的分析,已经成为机器学习、自然语言处理等领域的重点研究方向.本文通过对隐含狄利克雷分配(Latent Dirichlet Allocation,LDA)及其扩展模型的研究,提出一种适用于文档多标签判定的改进Labeled LDA模型.模型中的标记被映射为多个主题的组合,其中包含若干个独享的主题和共享主题.在文档类别判定过
其他文献
利用化学凝聚、静电吸附及吸附处理纤维板废水,得到很好的效果。利用此法,纤维板废水的CODCr值,从1988ppm降低为35ppm,除去的总效率达98%,净化水的水质无色,无味、透明。利用此法,不
“中国制造2025”战略的出台,开启了制造业由大到强的新征程;“互联网+”行动计划的提出,将互联网和包括传统行业在内的各行各业有机地结合起来,在新的领域创造出一种新的生态
2015年,我国印染行业积极通过加快结构调整、转型升级步伐,全行业经济运行总体保持平稳。2015年1~11月份,规模以上企业在产量降幅进一步加大的情况下,主营业务收入、利润、固定资
说到指尖知识(Fingertip Knowledge)这个概念,就不得不提到Elliot Masie。  Elliot Masie是个很了不起的人物,是数字化学习领域的先驱。他是培训与发展领域的大牛,是一间名叫MASIE的专门研究学习与科技的智库的创始人和总裁。Elliot Masie是一位未来学家、分析师和研究者,他是智库Elliot Masie中心的《学习趋势》(Learning Trend)
随着大数据时代的到来,培养和提高学生的信息素养成为信息技术课堂教学的重心。结合大数据时代信息瞬息万变、技术层出不穷的特点,本文主要从学生学习方式的变革和教师教学方
提出了一种基于长方晶格型声子晶体结构的波矢调制特性的声屏障设计机理.该声屏障能够以极低的反射率将入射声波导引至内部,并在相对于原有的传播方向偏移一定距离后出射,从
采用第一性原理局域密度近似下的投影缀加平面波方法精确计算并比较了钙钛矿材料PbZrO3低温正交相(反铁电相)、高温立方相(顺电相)的电子能带结构.PbZrO3作为一种重要的反铁电材
教材分析  《图片信息加工》是上海科技教育出版社出版的高中《信息技术基础》必修模块第三章第一节的内容。本节主要内容是让学生了解图像的类型及意义,掌握获取图形、图像的常用方法,初步掌握对图像信息的一些基本处理技能。本节课内容可以分为三部分。第一部分是了解图像的特点,知道不同格式的图片文件,了解图像的类型,理解图片的特点并掌握常用图片的格式。第二部分是掌握获取图形、图像的常用方法,这部分内容是学生应该
以甲基丙烯酸二甲氨基乙酯(DMAEMA)和甲基丙烯酸羟乙酯(HEMA)作为共聚单体,采用自由基聚合反应,成功合成了亲水性的无规共聚物poly(DMAEMA—CO—HEMA)。将该共聚物添加到聚偏氟乙烯(PV
日前,环保部正在编制“水十条”实施情况评估考核办法和实施细则,预计今年出台。值得注意的是,问责制将进一步细化落实,环保部将和各省市签订水污染防治目标责任书,地方若治理不力