论文部分内容阅读
本文依托国家社科基金重点项目“当代中国人际关系和谐的社会基础研究”(2007AZX004)中的2972份问卷调研数据,利用CHAID算法决策树挖掘模型、GRI关联规则挖掘模型、径向基神经网络挖掘模型和多分类Logistic回归挖掘模型对调查问卷数据进行预处理并从不同角度、不同层面进行深入挖掘,尤其是挖掘多个变量之间有趣的隐含关系。
本文首先在灵活运用数据挖掘的思维和Clementine数据挖掘软件中的相关节点的基础上,充分利用问卷中已有信息构造组合数据挖掘分类模型,对《影响中国人际关系和谐因素调查问卷》进行分类预处理;其次利用CHAID算法决策树数据挖掘模型从广度细分变量和深度细分变量两个方面对中国人际和谐程度进行人群细分,并重点分析对中国人际和谐程度满意度高和不满意度高的人群特点;接着通过设定不同支持度和置信度阈值的方式对数据集进行多次关联规则挖掘,并对挖掘出来的关联规则进行分析,尤其是通过进一步对正相关关联规则进行交叉分析和对负相关关联规则进行比较分析;为了进一步分析影响人际和谐的因素,最后建立多分类logistic回归模型。
通过数据挖掘技术的实证分析得出:中国人际和谐程度满意度高的人群学历反而偏低,军人、农民和工人对人际和谐程度满意度很高;而不满意度高的人群主要是在校学生,尤其像京津地区的学生不满意度均很高,另外西部地区的高学历者不满意度较高也值得关注;影响我国人际和谐程度的因素中,按重要程度分依次为社会道德水平状况、党和政府反腐倡廉工作的力度、我国民主建设水平、政府在应对突发事件和复杂局面时表现及人们的自身劳动收入水平。各因素的这种重要程度差异可以由多分类Logistic回归模型的系数和exp(B)值得到反映。