论文部分内容阅读
随着心理学科学的快速发展和信息处理技术在心理学领域的应用,国内外心理学研究者和有关部门长期对大量群体实施心理测量积累了庞大的宝贵数据资料。在这些大量的数据背后隐藏着许多有价值的信息,如从众多的个体人格特征数据中分析出群体的人格类型。传统的信息处理技术缺乏发现隐含在数据中有用信息的能力,而数据挖掘中的聚类分析技术能将数据划分成有意义或有用的组(簇)。
数据挖掘中的聚类分析在广泛的领域扮演着重要的角色。将数据挖掘技术应用到心理学研究中是一件非常有意义的事情:可为心理学研究者提供有力的技术手段支持,为心理矫治工作者在制定、选择心理矫治策略时提供科学依据,同时,也促进聚类分析理论和技术在心理学领域的应用、发展。本文结合罪犯的人格特征数据,探讨聚类分析技术在心理学领域的人格类型划分中的应用。
首先,简要介绍数据挖掘的基本概念,聚类分析的概念、应用状况和常用的聚类分析方法,并对应用最广泛的两种聚类方法——基于划分的k-平均方法和凝聚层次中的wards方法的优势和不足分别作了全面、深入的探讨和分析。
其次,结合心理学领域的人格特征数据的特点,探讨聚类分析技术在人格类型划分中的应用。
(1)选择传统k-平均算法作为本文聚类分析的核心算法;
(2)针对传统k-平均算法需要用户事先指定合适的簇个数、初始聚类中心的问题,提出一种基于wards方法优化k-平均算法初始参数的方法;
(3)在用wards方法对样本数据初步聚类的基础上,提出一种基于距离的检测、删除孤立点的方法,克服k-平均算法对孤立点敏感的不足。经过步骤(2)、(3)处理,得到一种优化的k-平均算法。
再次,在采用wards方法对样本数据进行初步聚类分析时,为获得能充分反映总体数据分布状况的样本数据,结合所分析的人格特征数据,提出分层抽样的方法,并通过实验验证分层抽样方法是非常有效的。
最后,通过罪犯的人格特征数据验证优化的k-平均算法其效率和聚类效果都明显优于传统的k-平均算法。并进一步证实优化的k-平均算法在人格类型划分中的有效性。