论文部分内容阅读
随着Internet的发展,web上信息呈爆炸式增长趋势,呈现方式也愈发多种多样,这就给多媒体内容的检索,信息提取等计算机处理带来了巨大困难.针对信息提取后,网页的多媒体内容的不一致性,该文提出了一种web网页多媒体信息提取的融合算法.该算法通过对图像和文本的语义的融合.判断通过信息提取后的网页中的各种形态的内容是否一致。对来自30个网站的307个网页进行测试后的实验表明.本文提出的方法是可行的.