基于多目标决策的产品搜索系统的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:frjazz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展,电子商务逐渐走进越来越多人的日常生活。如何从为数众多的产品中,选择最符合自身需求的产品,是用户购买决策的重要环节之一。互联网上产品的图片、参数、价格历史等客观数据,以及诸如用户评论、用户评分等海量的用户生成内容,能够帮助用户充分了解并仔细比较各种产品。  产品搜索是电子商务的重要入口,也是互联网搜索的主要类型之一。好的产品搜索引擎能够充分利用海量数据,特别是用户评论这样的口碑信息,考虑多方面因素来综合衡量产品的价值,帮助用户快速定位目标产品。  产品搜索与传统IR领域的网页搜索相比具有新的特点,主要表现在:搜索的应用类型不同;搜索的内容来源不同;搜索的结果粒度不同;搜索的用户需求不同。如何综合使用客观的产品数据和主观的用户生成内容,设计符合用户需求的搜索排序模型,是产品搜索面临的挑战。  目前关于产品搜索模型的相关研究有:基于文档空间向量模型的改进模型,基于元数据的搜索模型,基于情感分析结果和效用理论的特征模型。现有模型通常只是基于销量、价格、评分、评论数或者用户评论情感分析结果等单一或少量的因素对产品进行排序,不能较好地满足产品搜索的用户需求。  考虑到用户生成内容在电子商务中的作用,以及现有产品搜索模型的缺点,本文设计并实现了一个结合客观的产品数据和主观用户生成内容的,基于产品多个目标综合决策的产品搜索系统。本文的新思路在于:  ●基于产品多个目标综合决策的产品搜索模型:以多目标决策的效用理论、计量经济学的效用最大化原则、商品特征模型和离散选择模型为理论基础,提出了综合考虑产品的价格、功能、性能、外观、用户评分等多种目标因素的排序模型;  ●综合使用客观和主观数据:从产品参数、产品介绍等客观产品数据,和用户评分、产品评论等主观的用户生成内容中选取搜索模型特征,对中文用户评论的文本进行特征粒度的情感分析从中挖掘出消费者对于产品各个细节的主观评价,训练MNL模型预测消费者剩余作为搜索模型排序的依据;  ●通过对随机选取的搜索用户进行双盲实验的结果表明,该产品搜索模型的搜索效果比基准算法有显著的提高;  ●设计并实现了数码类的产品搜索系统:动态获取数码类的手机、笔记本电脑、数码相机的数据,构建并更新维护相关的产品数据库、倒排索引和情感分析库,实现了数码类的产品搜索系统原型,能够较好地对排序结果进行解释和可视化.
其他文献
随着生物医药技术以及计算机科学技术的发展,质谱分析技术在蛋白质组学及糖组学等多领域得到了应用,包括蛋白质鉴定、糖分子结构鉴定、生物标记物发现与疾病诊断建模等。  质
云计算自从被提出以后,就一直是国内外计算机网络技术研究的一个热点。随着云计算的广泛应用,云计算平台的安全性成为了云计算的核心问题之一。云计算与传统计算相比最大的变化
学位
在软件迭代更新的开发过程中,会出现测试用例与被测代码不一致的情况,即当前的程序代码,并不能够全部通过旧版本的测试用例。这可能由当前代码的错误引发,也可能是测试用例造成。
作为目标文件的集合,C语言函数库为系统运行和软件开发提供了必要的支持。64位技术的普及为计算机的发展注入了强劲动力。UniCore-3处理器是我国自主研发的64位处理器。为支持
语义角色标注的目的是分析句子中特定动词的论元结构,识别出与该动词具有搭配关系的论元并分析这些论元的语义角色。近年来,有指导的语义角色标注方法已经得到了比较全面的研
查询意图被定义为查询背后的信息需求,正确分类用户的查询意图,能够帮助商业化搜索引擎优化检索结果,提供更加准确的检索服务。由于用户的查询  关键词一般较短(平均长度2-3),
软件开发是一个迭代的过程,通常需要反复经历代码的编辑、编译、链接、运行和调试。这期间将使用到各种各样的开发工具,包括编辑器、编译器、链接器、汇编器、函数库、调试器等
基于NAND闪存的固态盘(SSD)作为磁盘的缓存设备已经广泛地应用在数据中心存储系统中。已有的固态盘缓存系统设计没有充分考虑闪存介质的特性,如擦后写、擦写粒度不对称、擦写
随着人类文明的不断发展,科技的不断进步,尤其是计算机学科的发展和Intemet的发展,人们需要面对的数据量越来越大。如何从海量数据中获得自己想要的知识,一直是一个备受关注