论文部分内容阅读
了解个体心理特征、主观感受对心理学研究、社会管理等具有重要意义。传统心理测量手段通常采用问卷、访谈等方式进行,受施测方法、环境等因素制约,在时效性、施测规模等方面具有一定的局限性。 随着互联网的蓬勃发展,社会媒体在人们的日常生活中得到了广泛地使用。由于用户发布的这些信息是其日常生活行为的记录,具有内容丰富、自然发生、规模庞大、数据记录可回溯等特点,使得社会媒体平台成为了理想的“在线心理学实验室”。通过对用户的在线行为记录进行分析,可以实时、大规模地了解个体心理特征、主观感受,弥补了传统心理测量手段的不足。 本文将机器学习方法应用于个体心理特征测量这一领域,提出了基于社会媒体用户网络行为数据,对个体进行非侵扰式生态瞬时心理特征评估计算的方法。研究方法采用有监督的机器学习方法:首先收集了具有心理特征标注的微博用户数据,心理特征标注采用心理学量表获得;然后针对社会媒体的功能,从考察用户社会媒体使用基本行为、语言特征和时间序列特征的角度,建立了用户行为特征体系;进而基于用户行为的特征数据及与之对应的心理特征标注,利用有监督机器学习算法,建立心理特征分类、回归预测模型,并对模型的有效性进行了验证。 我们在研究中开展了基于微博的用户实验,利用上述特征体系和建模方法,建立并评估了基于社会媒体的用户人格、心理健康、主观幸福感、自杀风险的预测计算模型。模型在人格、心理健康等心理特征高低分组分类问题上准确率约为80%;在人格、心理健康、主观幸福感心理特征得分预测问题上,模型预测结果与心理问卷结果的皮尔逊积矩相关系数可达0.4~0.6;在高自杀风险用户分类预测问题上,相较于人工检测,模型可以协助减少约40%的人工工作量。 本文研究结果表明,运用机器学习方法建立的心理特征预测模型,可以利用用户在社会媒体上的行为数据,开展对个体心理特征的大规模、实时预测计算,预测计算结果的有效性与心理学量表测评或他评相当。本文探索了基于互联网行为数据进行个体心理特征预测的方法论,研究结果可以为后续相关领域研究提供方法上的借鉴,研究过程中建立的模型也可进行应用和推广,为心理学研究和社会管理提供服务。