论文部分内容阅读
为了实现自动图像注释和多模态图像检索,提出了一种基于期望值最大化和贝叶斯法则实现的概率模型。将视觉特征和文本词通过一个隐层连接起来,利用图像的不同模式和附带信息之间的协同作用,构成语义概念用于被发现;提出了一种基于期望值最大化的迭代学习过程来确定视觉特征和给定一个隐概念类的词的条件概率;基于所得到的隐概念层和相应的条件概率,采用贝叶斯框架来实现图像到文本和文本到图像的自动注释和检索。实验结果表明,文中提出的基于期望值最大化和贝叶斯法则的概率模型在HR3、CL和SWQP(n)性能上均优于目前先进的基于