论文部分内容阅读
针对医生的在线评论已经成为了影响用户就医决策的重要的电子健康资源。正如人们在购买一款商品前会去查看该商品的口碑一样,人们在决定选择某个医生或医院前也会去查看相应的评论。在线医生评论是一个宝贵的金库,里面包含了涉及医生能力、服务态度、职业道德水平、设施情况、收费情况等诸多方面的信息。并且医疗市场还是一个信息高度不对称的市场,因此在线医生评论的信息将对用户的选择决策产生决定性的影响。然而,目前针对这一信息宝库的相关研究还非常有限。具体来说,我们不知道在线医生评论中包含哪些有用的主题,也没有一种自动化的方法来识别和抽取这些主题,更不知道这些主题如何影响用户对其有用性的判断。解决这些问题,将有助于我们更加有效的利用在线医生评论信息,同时也可以指导用户更加高效的撰写医生评论。 因此,本文从三个方面展开了研究。首先,提出了一种定性内容分析与定量LDA主题模型相结合的方法,归纳总结出在线医生评论中所包含的主题维度。其次,基于Labeled-LDA主题模型,我们构建了一种自动提取在线医生评论主题的机器学习模型。最后,以儿科病、急性病、慢性病和重大疾病为例,采用模糊集定性比较分析(fsQCA)的方法,研究挖掘出了不同疾病类型下影响评论有用性的关键主题和最优主题组合。 本研究识别出了医生评论中包含的重要主题,这是有效利用医生评论的一个基本前提。同时,本文还提出了一种识别和抽取这些主题的自动化方法,为大规模利用医生评论信息奠定了基础。最后,本文还探索了不同主题及其组合如何影响评论有用性的规律,为有效组织和呈现医生信息提供了帮助,同时也有利于指导用户撰写更加有用的医生评论。针对不同的疾病,系统可以有针对性的选择那些最有价值的维度组合进行展现,从而缓解信息过载的问题;同时也可以让用户有意识的针对最有用的维度撰写评论,从而将有限的人力资源效用最大化。最后,本研究还有助于理解用户是如何选择医生的,了解医患关系产生的根源,从而帮助医院规范管理,缓解紧张的医患关系。