论文部分内容阅读
消费者健康信息需求是指当患者或患者的亲戚出现自我感觉身体不适时,主动寻求相关健康知识以获取所需健康信息,以确定症状,排除忧虑的愿望和渴望。随着互联网技术以及社会化问答社区的日益成熟,消费者接触网络健康信息的渠道和数量迅速增加,学术界、医疗机构以及政府相关机构对消费者健康信息的需求愈发重视。然而,目前对消费者健康信息需求的研究通常聚焦于某一种疾病,且研究方法多以问卷调查、焦点小组访谈等定性研究方法为主,导致研究的样本数量有限,对某类疾病的研究结果很难适用于其他疾病。因此,本研究结合归纳法的思想,利用文本挖掘信息分析方法,构建了消费者健康信息需求模型,并对模型进行了优化,讨论了模型的具体应用场景。首先,本研究对当前消费者健康信息需求的研究现状进行了梳理,对国内外学者的研究内容和研究方法进行了总结和分析,从而快速地了解各项消费者健康信息需求研究的主要结果及其优势与不足。其次,本研究介绍了目前常用的几种特征词提取方法,并利用TF-IDF方法提取本文的特征词。之后将提取出的特征词(包括通用词语和专有词语)归类到十项健康信息需求类目中,从而构建出消费者健康信息需求模型。再者,本研究对所构建的消费者健康信息需求模型存在的不足之处逐一优化。利用咳嗽提问文本信息对通用词语归类不准确的问题进行了优化,使得一些有歧义的专有词语转变成了通用词语,效果较为显著。针对部分需求类目缺少专有词语的问题,利用糖尿病文本信息的最佳答案对部分需求类目缺少专有词语的问题进行了优化,使得模型具有可扩展性。最后,本研究提出了消费者健康信息需求模型的三类应用场景:改善公共图书馆健康信息服务,优化健康类网站的可用性,优化消费者健康信息搜寻行为。