论文部分内容阅读
社交媒体平台是基于用户关系的内容生产与交换平台,如论坛、微信等。随着社交媒体平台的流行度与认可度不断提高,人们的阅读方式发生了显著变化,对传统纸质阅读所投入的时间不断减少,而对在线阅读投入的时间逐步增多。在互联网环境中用户不再只是信息的接收者,更是信息资源的创作者和传播者,这导致了社交媒体帖子的爆发式增长。目前,社交媒体上帖子面临着两大急需解决的难题:一方面,用户在社交媒体平台发表了海量的帖子,使得网络信息资源越来越丰富的同时,用户面临着信息过载的挑战;另一方面,由于每个作者的文化素养和知识累积都不相同,社交媒体上的帖子质量也是大相径庭,呈现出符合二八定律的分布,即只有少部分的帖子是非常有价值的。这使得用户无法快速找到高质量的社交媒体帖子。因此,本文将探索社交媒体帖子有效性影响因素,构建社交媒体帖子有效性影响因素理论框架,在此基础上延伸至用机器学习方法实现社交媒体帖子有效性的自动评估,以期为网络环境的健康可持续发展提供理论与实践指导。
在对国内外社交媒体帖子有效性的相关文献进行整理分析后,本文发现前人对社交媒体帖子有效性影响因素的研究主要是探索内容质量特征与信息源特征对帖子有效性的影响作用,而未考虑标题特征与结构特征对社交媒体帖子有效性的影响作用。此外,前人研究也未考虑社交媒体帖子有效性自动识别系统的实现。因此,本文围绕社交媒体帖子有效性的二个维度(吸引力和有用性),通过实证与机器学习的方法来开展研究。本文的研究问题包括:标题如何通过不同的说服方式影响社交媒体帖子吸引力;领域相关性和领域专业性特征是否影响社交媒体帖子感知有用性;如何构建社交媒体帖子有效性影响因素的理论框架;基于本文所提出的理论框架,如何实现社交媒体帖子质量的自动评估预测,这些问题的解决能为用户高效筛选有价值的网络信息资源以及维持网络环境健康发展提供有力的理论依据以及技术支持。本文主要工作与结论如下:
首先,探索了社交媒体帖子标题特征对用户的说服过程及说服效果。基于双路径模型——精细加工可能性模型(Elaboration Likelihood Model,ELM),本文研究了社交媒体帖子标题特征和账号属性对社交媒体帖子吸引力的影响作用。以126个微信公众号从创建账号时间到2016年5月12日所发布的113,869篇帖子为研究对象,通过文本挖掘方法挖掘标题特征,通过计量经济学方法对标题特征与社交媒体帖子之间的关系进行了实证检验。研究结果表明,标题的长度,情感与语言强度对社交媒体帖子吸引力有显著的影响作用。标题正面情感对社交媒体帖子吸引力有负向的影响作用。标题负面情感对社交媒体帖子吸引力有正向的影响作用。此外,负面情感的程度与帖子吸引力之间呈倒U型关系。标题长度与社交媒体帖子也是倒U型关系。标题语言强度对社交媒体帖子吸引力有正向的影响作用。此外,本文发现账号类型对标题情感与社交媒体帖子吸引力之间关系具有调节作用。
其次,研究了领域相关性和领域专业性对社交媒体帖子有用性的影响作用。基于精细加工可能性模型,把从社交媒体帖子正文内容挖掘的五个特征(情感、深度、可读性、领域相关性和领域专业性)确定为中心路线特征,把从信息来源提取的特征(作者专业性)确定为边缘路径特征。在考虑内容质量与来源可信度的同时,本研究主要关注了内容质量的领域相关性和领域专业性两个特征。更具体地说,本研究探索了领域相关性和领域专业性对社交媒体帖子感知有用性的影响作用。以从股吧平台上获取的177,556篇社交媒体帖子为研究样本,通过对计量经济学、数据挖掘和机器学习方法,本文探索了领域相关性和领域专业性是否以及在多大程度上对社交媒体帖子感知有用性产生影响作用。本文研究表明,领域相关性和领域专业性都对社交媒体帖子感知有用性有显著的影响作用。此外,领域专业性与社交媒体帖子感知有用性之间呈U型关系。本文认为社交媒体帖子感知有用性的评估是一个分类问题。通过使用朴素贝叶斯、AdaBoost和决策树三种算法,本文构建了3个不同的分类器,结果表明用决策树构建的分类器性能优于其他分类器,精度为81.5%。
然后,构建了社交媒体帖子有效性影响因素的理论框架。基于双路径模型——启发和系统式信息处理理论,本研究构建了社交媒体帖子有效性影响因素的理论框架,在这个框架中评估了有效性的两个维度:吸引力和有用性。结合文本挖掘、情感分析和计量经济学的方法,通过分析126个微信公众号所发布的113,869篇社交媒体帖子,本研究探索了标题和正文内容特征对帖子有效性的影响作用。研究结果表明,标题特征对社交媒体帖子吸引力有显著的影响作用。标题特征与正文内容特征对社交媒体帖子有用性有显著的影响作用,这意味着本研究所提出的框架可以很好地解释社交媒体帖子的有效性。此外,这些影响因素的作用机制会因来源可信度的变化而有所不同。
最后,基于集成学习实现了社交媒体帖子有效性的自动评估。基于通过实证研究所构建的社交媒体帖子有效性影响因素理论框架(标题特征、信息源特征、内容特征与结构特征),本文使用集成学习的方法对社交媒体帖子有效性进行了自动评估,对帖子吸引力和有用性的预测准确率分别达到79.1%和84.0%,高于三个Baseline模型的评估准确率,研究表明本文所构建的社交媒体帖子有效性自动评估系统是有效的。
本研究丰富了社交媒体帖子有效性影响因素及社交媒体帖子有效性自动评估的相关研究,创新性体现在如下几个方面:第一,本文关注了社交媒体帖子标题对用户点开阅读帖子正文内容的说服过程和说服效果,以及标题不同特征说服效果的差异性。研究发现标题正面情感对社交媒体帖子吸引力有显著的负向影响作用。标题负面情感对社交媒体帖子吸引力有显著的正向影响作用。此外,标题负面情感的程度与社交媒体帖子吸引力呈倒U型关系。第二,针对以往对社交媒体帖子有效性的研究主要探索了内容特征和信息源特征的影响作用,而未考虑标题特征与结构特征的影响,通过实证分析,本研究发现标题特征与结构特征都对社交媒体帖子有效性有显著的影响作用,此发现进一步完善了社交媒体帖子有效性影响因素的理论框架。第三,虽然前人对社交媒体帖子有用性影响因素已经做出了丰富的研究成果,但忽略了领域相关性与领域专业性对社交媒体帖子有用性的影响作用。本文通过实证分析的方法验证了领域相关性和领域专业性特征对社交媒体帖子有用性有显著的影响作用。此外,领域专业性与社交媒体帖子有用性之间的关系是非线性的,是U型的关系。第四,基于实证研究构建的社交媒体帖子有效性影响因素理论框架,本文通过集成学习的方法对社交媒体帖子有效性实现了自动评估,为用户高效筛选信息提供了实践指导,同时为维持网络信息资源环境健康发展提供了支持。
在对国内外社交媒体帖子有效性的相关文献进行整理分析后,本文发现前人对社交媒体帖子有效性影响因素的研究主要是探索内容质量特征与信息源特征对帖子有效性的影响作用,而未考虑标题特征与结构特征对社交媒体帖子有效性的影响作用。此外,前人研究也未考虑社交媒体帖子有效性自动识别系统的实现。因此,本文围绕社交媒体帖子有效性的二个维度(吸引力和有用性),通过实证与机器学习的方法来开展研究。本文的研究问题包括:标题如何通过不同的说服方式影响社交媒体帖子吸引力;领域相关性和领域专业性特征是否影响社交媒体帖子感知有用性;如何构建社交媒体帖子有效性影响因素的理论框架;基于本文所提出的理论框架,如何实现社交媒体帖子质量的自动评估预测,这些问题的解决能为用户高效筛选有价值的网络信息资源以及维持网络环境健康发展提供有力的理论依据以及技术支持。本文主要工作与结论如下:
首先,探索了社交媒体帖子标题特征对用户的说服过程及说服效果。基于双路径模型——精细加工可能性模型(Elaboration Likelihood Model,ELM),本文研究了社交媒体帖子标题特征和账号属性对社交媒体帖子吸引力的影响作用。以126个微信公众号从创建账号时间到2016年5月12日所发布的113,869篇帖子为研究对象,通过文本挖掘方法挖掘标题特征,通过计量经济学方法对标题特征与社交媒体帖子之间的关系进行了实证检验。研究结果表明,标题的长度,情感与语言强度对社交媒体帖子吸引力有显著的影响作用。标题正面情感对社交媒体帖子吸引力有负向的影响作用。标题负面情感对社交媒体帖子吸引力有正向的影响作用。此外,负面情感的程度与帖子吸引力之间呈倒U型关系。标题长度与社交媒体帖子也是倒U型关系。标题语言强度对社交媒体帖子吸引力有正向的影响作用。此外,本文发现账号类型对标题情感与社交媒体帖子吸引力之间关系具有调节作用。
其次,研究了领域相关性和领域专业性对社交媒体帖子有用性的影响作用。基于精细加工可能性模型,把从社交媒体帖子正文内容挖掘的五个特征(情感、深度、可读性、领域相关性和领域专业性)确定为中心路线特征,把从信息来源提取的特征(作者专业性)确定为边缘路径特征。在考虑内容质量与来源可信度的同时,本研究主要关注了内容质量的领域相关性和领域专业性两个特征。更具体地说,本研究探索了领域相关性和领域专业性对社交媒体帖子感知有用性的影响作用。以从股吧平台上获取的177,556篇社交媒体帖子为研究样本,通过对计量经济学、数据挖掘和机器学习方法,本文探索了领域相关性和领域专业性是否以及在多大程度上对社交媒体帖子感知有用性产生影响作用。本文研究表明,领域相关性和领域专业性都对社交媒体帖子感知有用性有显著的影响作用。此外,领域专业性与社交媒体帖子感知有用性之间呈U型关系。本文认为社交媒体帖子感知有用性的评估是一个分类问题。通过使用朴素贝叶斯、AdaBoost和决策树三种算法,本文构建了3个不同的分类器,结果表明用决策树构建的分类器性能优于其他分类器,精度为81.5%。
然后,构建了社交媒体帖子有效性影响因素的理论框架。基于双路径模型——启发和系统式信息处理理论,本研究构建了社交媒体帖子有效性影响因素的理论框架,在这个框架中评估了有效性的两个维度:吸引力和有用性。结合文本挖掘、情感分析和计量经济学的方法,通过分析126个微信公众号所发布的113,869篇社交媒体帖子,本研究探索了标题和正文内容特征对帖子有效性的影响作用。研究结果表明,标题特征对社交媒体帖子吸引力有显著的影响作用。标题特征与正文内容特征对社交媒体帖子有用性有显著的影响作用,这意味着本研究所提出的框架可以很好地解释社交媒体帖子的有效性。此外,这些影响因素的作用机制会因来源可信度的变化而有所不同。
最后,基于集成学习实现了社交媒体帖子有效性的自动评估。基于通过实证研究所构建的社交媒体帖子有效性影响因素理论框架(标题特征、信息源特征、内容特征与结构特征),本文使用集成学习的方法对社交媒体帖子有效性进行了自动评估,对帖子吸引力和有用性的预测准确率分别达到79.1%和84.0%,高于三个Baseline模型的评估准确率,研究表明本文所构建的社交媒体帖子有效性自动评估系统是有效的。
本研究丰富了社交媒体帖子有效性影响因素及社交媒体帖子有效性自动评估的相关研究,创新性体现在如下几个方面:第一,本文关注了社交媒体帖子标题对用户点开阅读帖子正文内容的说服过程和说服效果,以及标题不同特征说服效果的差异性。研究发现标题正面情感对社交媒体帖子吸引力有显著的负向影响作用。标题负面情感对社交媒体帖子吸引力有显著的正向影响作用。此外,标题负面情感的程度与社交媒体帖子吸引力呈倒U型关系。第二,针对以往对社交媒体帖子有效性的研究主要探索了内容特征和信息源特征的影响作用,而未考虑标题特征与结构特征的影响,通过实证分析,本研究发现标题特征与结构特征都对社交媒体帖子有效性有显著的影响作用,此发现进一步完善了社交媒体帖子有效性影响因素的理论框架。第三,虽然前人对社交媒体帖子有用性影响因素已经做出了丰富的研究成果,但忽略了领域相关性与领域专业性对社交媒体帖子有用性的影响作用。本文通过实证分析的方法验证了领域相关性和领域专业性特征对社交媒体帖子有用性有显著的影响作用。此外,领域专业性与社交媒体帖子有用性之间的关系是非线性的,是U型的关系。第四,基于实证研究构建的社交媒体帖子有效性影响因素理论框架,本文通过集成学习的方法对社交媒体帖子有效性实现了自动评估,为用户高效筛选信息提供了实践指导,同时为维持网络信息资源环境健康发展提供了支持。