【摘 要】
:
Replicated Softmax model,是用于文本数据挖掘的无向概率主题模型,为描述语料库的主题分布提供了一个功能强大的框架.然而,作为一个无向的概率图模型,由于归一化常数的
论文部分内容阅读
Replicated Softmax model,是用于文本数据挖掘的无向概率主题模型,为描述语料库的主题分布提供了一个功能强大的框架.然而,作为一个无向的概率图模型,由于归一化常数的存在,该模型的参数学习是十分困难的.针对这一问题,利用退火过渡(Tempered Transitions)马尔科夫蒙特卡洛采样方法,提出了一种新的近似极大似然学习算法TT-SAP.该算法采用基于退火过渡的马尔科夫蒙特卡洛采样方法,高效地探索存在多个孤立的模态的概率分布,提高对概率分布的逼近程度,从而高效率、高精度地实现参数学习.实验结果表明了,TT-SAP算法在训练时间、泛化能力和文档检索等三个方面的优势.
其他文献
本研究以辽宁鞍山种植的雅龙果为实验材料,采用多种色谱技术(硅胶柱色谱、活性炭色谱、大孔吸附色谱、葡聚糖凝胶色谱、聚丙烯酰胺色谱、制备薄层色谱等),对雅龙果干燥叶子的95
旨在探索Na3V2O2(PO4)2F钠离子电池正极材料的制备方法和性能研究,构建高功率密度和长循环稳定性的钠离子电池储能体系。Na3V2O2(PO4)2F正极材料的容量和倍率性能受制于较大的
相似自连接是一个在很多应用领域中很重要的问题。对于海量数据集,MapReduce可以提供一个有效的分布式计算框架,相似自连接操作也同样可以应用在MapReduce框架下。但已有
信息化的发展使得数据存储及表示形式呈现出分布性、异构性的特点,不仅包括关系数据库、面向对象数据库等传统结构化数据,还包括Excel、CSV等不具有明确结构的特殊非结构化
近年来,高密度水产养殖业的快速发展带来了水环境污染的日益加剧,致使各种水产病害特别是病毒性疾病大规模爆发,给鱼类养殖造成了巨大的经济损失。新加坡石斑鱼虹彩病毒(Singapo
煤炭是我国主要的一次能源,且绝大多数煤炭资源储量是低阶煤。因此,开发低阶煤的高效利用工艺,对我国能源、环境的可持续发展意义重大。煤拔头固体热载体工艺是一种高效清洁利用
电商类网站的兴起与用户在线购物习惯的形成,带来了海量的在线消费行为数据。如何利用这些行为数据(如点击数据)将用户对相似商品的比较和选择的过程建模,进而准确预测用户
几丁质酶普遍存在于各种动物、植物和微生物中,在医药、食品、环保、生防等许多领域显示出广阔的应用前景。国内外已经筛选出多种几丁质酶产生菌,并将其进行分离纯化。但只有
本论文采用纳米氮化硅粉体作为填料,通过高速剪切和超声波复合分散后,用热固化法制备了纳米氮化硅环氧树脂复合材料.为了使得纳米氮化硅能很好地分散于环氧树脂基体中,以硅烷
大数据的时代已经来临。人们在享受大数据带来的丰富知识和各种个性化服务的同时,个人的隐私也面临着泄露的风险。如何保护数据的隐私安全已经成为一个研究热点。本文针对