论文部分内容阅读
数据挖掘是数据库技术开发的成果,在当前越来越多领域中获得了普遍应用,最主要的优势便是数据的价值分析,运用数据挖掘工具来深度挖掘信息资源的利用价值。对于社会保险决策分析来说,数据挖掘技术应用方面的研究仍然不够全面,在各种专著中大多仅涉及社会保障部或劳动部等。以社会保险决策分析的现状来看,很多信息数据存在着浪费的现象,数据挖掘技术的合理运用则可以帮助工作人员在海量数据中挖掘潜在的价值和规律,通过多种数据挖掘方法来实现数据资源的深度利用,为社会保险决策分析提供可靠的依据。本文主要围绕社会保险决策分析展开论述,探讨了数据挖掘技术的应用对策。
近年来互联网技术的快速发展使得计算机网络的功能性也越来越多元化,各地“金保工程”水保险管理信息系统为人们办理有关的养老保险缴费和变更等业务,利用计算机系统将养老、医疗、生育等社会保障信息传输到省级集中式核心数据库。但怎样才能在社会保险的多个险种参保人员数据中分析出问题数据,为社会保险基金监管工作提供参考则成了当下需要重点探讨和解决的问题,以往的信息数据管理模式随着当前社会保障信息数量的快速累积也显得力不从心,效率难以达到现实要求。对此数据挖掘技术的应用使得这一现状有了新的突破,为社会保险基金监管中的决策分析工作带来了更加充足且真实的数据支持。
人工智能技术和数据库技术是近几年的热门研究领域,而数据挖掘技术则是这两项技术下的产物,也属于计算机科学技术,计算机技术的快速发展以及普及对数据挖掘技术的产生和推广来说具有先决性作用。数据挖掘是在大量数据之中提取信息价值的技术手段,利用灵活的数据挖掘和分析算法,在目标数据中建立模型,以人工智能技术作为支持,但仅借用人工智能中较为成熟的算法和技术手段,例如决策树和人工神经网络等,问题的复杂度和难度相较于人工智能来说耕地。数据挖掘技术的应用方法也不止一种,应用较为广泛的有序列模式分析、关联分析、分类分析等,具体原理介绍如下:1.关联分析。管理分析主要通过关联规则来实现数据的挖掘,关联规则指的是事物间存在的规律知识模式,关联分析主旨在于进一步找出数据之间潜在的关系和规律。2.序列模式分析。序列模式分析和关联分析的原理并没有太大差异,结合数据存在的关联性和时间性特征,为了解序列模式,需要了解事件发生与否,并且找出事件的产生时间,主旨仍然是找出数据间潜在的关系和规律,但相比之下序列模式分析更加关注数据与数据之间是否存在因果关系。3.分类分析。分类分析指的是分类示例数据库中的数据,针对不同的数据进行描述,建立对应的分析模型或挖掘分类的规律,将数据集中的数据映射于某一既定的类中,输入集是一组记录集合与多个标记。4.聚类分析。聚类分析和分类分析具有很大差异,输入集通常为一组没有标定的记录,这一期间输入的记录并没有任飞处理,分析的主旨则是结合已知的规律进行记录集合的划分,让不同的组具有更大的区别,而组内的区别则尽量降低。
结合数据挖掘技术的基本特征,数据挖掘技术在社会保险决策分析中的应用能够在社保对象分析、社保基金管理、社保决策管理等方面发挥良好的作用效果,而数据挖掘技术的应用方式主要有以下几点:
通过聚类分析法分析参保群体类别
目前,数据处理技术的不断进步,功能性和便利性都有了进一步增强,成了社会保险基金管理工作的开展工具之一,这也代表社会保险机构可以运用数据处理和挖掘等方式来深入了解参保人群,根据参保人群的基本特征和需求进行准确了解,提高服务水平,也让社会保险决策更加契合更多参保人群。
分析参保人群基本背景
对于社会保险决策分析工作来说,掌握参保人群的背景资料能够帮助工作人员分析参保对象,进一步完善或调整社会保障策略。而数据挖掘技术最主要的优势便是在海量数据信息中找到对社会保险决策分析有用的信息数据,在提高信息处理效率的同时也为社会保险决策分析带来了更加可靠的支持。
分析参保人员信用
分析参保人员的信用信息有助于针对参保人群根据信用情况进行等级划分,对于社会保险机构的决策分析以及管理工作来说具有重大意义,针对不同信用等級的参保人员选择不同的监督管理方式。数据挖掘技术能够在历史信息中分析参保人员的信用记录,从而准确划分信用等级。
数据资源的挖掘与共享
数据挖掘技术的应用对于数据收集工作具有更加严格的工作要求,这对于社会保险数据的收集及整合工作来说也带来了一定压力,为进一步提高社会保险机构的服务水平,实现精准化服务,便需要将数据库平台资源一同整合,实现资源利用率的最大化,更有利于数据的快速分析和共享,节约成本投入的同时也改善数据资源的利用率。
某省金保工程社会保险管理信息系统于1996年建立并发展,互联网技术的应用使得本地域访问社会保险信息数据能够被域网中所有的劳动保障机构访问和管控。该系统属于信息资源系统,最主要的特征便是开发了公共空间,能够让工作人员进行收据信息的读取。同时也是一种独特的管理模式,不同的社会保险服务站用户能够利用核心数据平台的网络快速为参保人处理保险业务,工作效率与质量都有了明显提高。
明确问题类型
在遭遇具体的应用问题时,需要找到问题的类型,之后按照不同类型问题选择对应的处理方法。如在进行参保目标的信用分析过程中,便需要针对参保目标信用分析问题进行分类,若这一问题不能通过数据挖掘工具直接解决,则需要选择其他更适合的办法来执行。
选择数据挖掘技术
在了解问题所属的类型之后,便可以根据问题的具体类型选择合理的数据挖掘技术。还是以参保目标信用分析问题为例,在找到任务主要分形后可以选择几种技术手段来解决,如人工神经网络和遗传算法技术等。在完成问题分类和技术选择后,还可以根据不同类的信用等级以及问题预测来选择数据挖掘技术与对应的工具,预测未来可能会对性能及可靠性带来影响的因素,确保技术和工具选择的有效性。 数据预处理
在数据处理过程中可能会出现脏数据的现象,原因基本在于输入错误、编码不一致、重复记录等,數据挖掘的预处理是生成事务模式与有效审计的关键。首先需要对初始数据采集进行校验,有关的技术有一次性采集和数据提取等。在现有数据信息的基础上,数据的质量及数量都可能会对数据挖掘的整体效果带来影响,对此需要在大量的参保数据中徐州那好和分析问题相关的样本数据子集,进而控制数据处理量。但这一过程中也要确保样本子集具有一定的代表性特征,之后便可以对数据进行预处理和分析,对存在的问题进行量化分析。最后结合问题解决的需要来调整数据,如数据的组合和删减等操作,对问题的状态进行描述。
构建模型
在完成数据挖掘技术的选择以及数据预处理后,便可以进行模型构建操作,这也是数据挖掘技术应用过程中的重要环节。技术方案选择的不同也会对模型带来影响,模型结果的可理解性也具有不同。如通过神经网络技术而生成的结果相比于其他方法来说理解难度较大。此外,模型结果的分析与描述也是至关重要的步骤,若描述不合理也会出现误导问题。
证实与评价
经过上述几个环节后,可以得出分析结果及模型,这也是对问题的多角度描述。这是还要对分析结果进行验证与评价,才能得出可用的决策信息。可以选择的方法也具有一定不同,可以选择用来建立模型的样本数据进行检验,也可以寻找另一批数据来完成检验,还可以在运作过程中取出新的数据进行检验。
随着社会经济的快速发展,保险业务对于人们的生活来说具有重大意义,而为了全面推进社会保险决策分析业务的发展和完善,则需要引进现代化的技术手段来进行优化。数据挖掘技术能够有效加强保险数据分析水平,提高数据利用率的同时让保险决策分析变得更加精确有效,因此保险企业需要组织技术人员积极学习新技术,推动参保人群分析技术的创新优化,也加强保险业务信息化水平,为保险公司的发展带来稳定的支持。
(青岛市即墨区社会劳动保险事业处)
参考文献:
[1]石小娟,方婧.数据挖掘技术在社保审计中的运用[J].纳税,2017:90.
[2]赵丹.数据挖掘技术在社会保险决策分析上的应用[J].信息技术, 2007: 130-132.
[3]蔡艳,胡晓军.数据挖掘技术在社会保险信息分析中的应用浅析[J].今日财富,2009:108-109.
[4]郑秉文. 中国社会保险经办服务体系的现状、问题及改革思路[J]. 中国人口科学,2013,(06):2-16+126.
[5]闵旭蓉. 基于数据挖掘技术的社会保险宏观决策支持系统模型研究[D].河海大学,2006.
近年来互联网技术的快速发展使得计算机网络的功能性也越来越多元化,各地“金保工程”水保险管理信息系统为人们办理有关的养老保险缴费和变更等业务,利用计算机系统将养老、医疗、生育等社会保障信息传输到省级集中式核心数据库。但怎样才能在社会保险的多个险种参保人员数据中分析出问题数据,为社会保险基金监管工作提供参考则成了当下需要重点探讨和解决的问题,以往的信息数据管理模式随着当前社会保障信息数量的快速累积也显得力不从心,效率难以达到现实要求。对此数据挖掘技术的应用使得这一现状有了新的突破,为社会保险基金监管中的决策分析工作带来了更加充足且真实的数据支持。
数据挖掘技术介绍
人工智能技术和数据库技术是近几年的热门研究领域,而数据挖掘技术则是这两项技术下的产物,也属于计算机科学技术,计算机技术的快速发展以及普及对数据挖掘技术的产生和推广来说具有先决性作用。数据挖掘是在大量数据之中提取信息价值的技术手段,利用灵活的数据挖掘和分析算法,在目标数据中建立模型,以人工智能技术作为支持,但仅借用人工智能中较为成熟的算法和技术手段,例如决策树和人工神经网络等,问题的复杂度和难度相较于人工智能来说耕地。数据挖掘技术的应用方法也不止一种,应用较为广泛的有序列模式分析、关联分析、分类分析等,具体原理介绍如下:1.关联分析。管理分析主要通过关联规则来实现数据的挖掘,关联规则指的是事物间存在的规律知识模式,关联分析主旨在于进一步找出数据之间潜在的关系和规律。2.序列模式分析。序列模式分析和关联分析的原理并没有太大差异,结合数据存在的关联性和时间性特征,为了解序列模式,需要了解事件发生与否,并且找出事件的产生时间,主旨仍然是找出数据间潜在的关系和规律,但相比之下序列模式分析更加关注数据与数据之间是否存在因果关系。3.分类分析。分类分析指的是分类示例数据库中的数据,针对不同的数据进行描述,建立对应的分析模型或挖掘分类的规律,将数据集中的数据映射于某一既定的类中,输入集是一组记录集合与多个标记。4.聚类分析。聚类分析和分类分析具有很大差异,输入集通常为一组没有标定的记录,这一期间输入的记录并没有任飞处理,分析的主旨则是结合已知的规律进行记录集合的划分,让不同的组具有更大的区别,而组内的区别则尽量降低。
数据挖掘技术在社会保险决策分析中的应用方式
结合数据挖掘技术的基本特征,数据挖掘技术在社会保险决策分析中的应用能够在社保对象分析、社保基金管理、社保决策管理等方面发挥良好的作用效果,而数据挖掘技术的应用方式主要有以下几点:
通过聚类分析法分析参保群体类别
目前,数据处理技术的不断进步,功能性和便利性都有了进一步增强,成了社会保险基金管理工作的开展工具之一,这也代表社会保险机构可以运用数据处理和挖掘等方式来深入了解参保人群,根据参保人群的基本特征和需求进行准确了解,提高服务水平,也让社会保险决策更加契合更多参保人群。
分析参保人群基本背景
对于社会保险决策分析工作来说,掌握参保人群的背景资料能够帮助工作人员分析参保对象,进一步完善或调整社会保障策略。而数据挖掘技术最主要的优势便是在海量数据信息中找到对社会保险决策分析有用的信息数据,在提高信息处理效率的同时也为社会保险决策分析带来了更加可靠的支持。
分析参保人员信用
分析参保人员的信用信息有助于针对参保人群根据信用情况进行等级划分,对于社会保险机构的决策分析以及管理工作来说具有重大意义,针对不同信用等級的参保人员选择不同的监督管理方式。数据挖掘技术能够在历史信息中分析参保人员的信用记录,从而准确划分信用等级。
数据资源的挖掘与共享
数据挖掘技术的应用对于数据收集工作具有更加严格的工作要求,这对于社会保险数据的收集及整合工作来说也带来了一定压力,为进一步提高社会保险机构的服务水平,实现精准化服务,便需要将数据库平台资源一同整合,实现资源利用率的最大化,更有利于数据的快速分析和共享,节约成本投入的同时也改善数据资源的利用率。
数据挖掘技术在社会保险决策分析中的应用过程
某省金保工程社会保险管理信息系统于1996年建立并发展,互联网技术的应用使得本地域访问社会保险信息数据能够被域网中所有的劳动保障机构访问和管控。该系统属于信息资源系统,最主要的特征便是开发了公共空间,能够让工作人员进行收据信息的读取。同时也是一种独特的管理模式,不同的社会保险服务站用户能够利用核心数据平台的网络快速为参保人处理保险业务,工作效率与质量都有了明显提高。
明确问题类型
在遭遇具体的应用问题时,需要找到问题的类型,之后按照不同类型问题选择对应的处理方法。如在进行参保目标的信用分析过程中,便需要针对参保目标信用分析问题进行分类,若这一问题不能通过数据挖掘工具直接解决,则需要选择其他更适合的办法来执行。
选择数据挖掘技术
在了解问题所属的类型之后,便可以根据问题的具体类型选择合理的数据挖掘技术。还是以参保目标信用分析问题为例,在找到任务主要分形后可以选择几种技术手段来解决,如人工神经网络和遗传算法技术等。在完成问题分类和技术选择后,还可以根据不同类的信用等级以及问题预测来选择数据挖掘技术与对应的工具,预测未来可能会对性能及可靠性带来影响的因素,确保技术和工具选择的有效性。 数据预处理
在数据处理过程中可能会出现脏数据的现象,原因基本在于输入错误、编码不一致、重复记录等,數据挖掘的预处理是生成事务模式与有效审计的关键。首先需要对初始数据采集进行校验,有关的技术有一次性采集和数据提取等。在现有数据信息的基础上,数据的质量及数量都可能会对数据挖掘的整体效果带来影响,对此需要在大量的参保数据中徐州那好和分析问题相关的样本数据子集,进而控制数据处理量。但这一过程中也要确保样本子集具有一定的代表性特征,之后便可以对数据进行预处理和分析,对存在的问题进行量化分析。最后结合问题解决的需要来调整数据,如数据的组合和删减等操作,对问题的状态进行描述。
构建模型
在完成数据挖掘技术的选择以及数据预处理后,便可以进行模型构建操作,这也是数据挖掘技术应用过程中的重要环节。技术方案选择的不同也会对模型带来影响,模型结果的可理解性也具有不同。如通过神经网络技术而生成的结果相比于其他方法来说理解难度较大。此外,模型结果的分析与描述也是至关重要的步骤,若描述不合理也会出现误导问题。
证实与评价
经过上述几个环节后,可以得出分析结果及模型,这也是对问题的多角度描述。这是还要对分析结果进行验证与评价,才能得出可用的决策信息。可以选择的方法也具有一定不同,可以选择用来建立模型的样本数据进行检验,也可以寻找另一批数据来完成检验,还可以在运作过程中取出新的数据进行检验。
结 语
随着社会经济的快速发展,保险业务对于人们的生活来说具有重大意义,而为了全面推进社会保险决策分析业务的发展和完善,则需要引进现代化的技术手段来进行优化。数据挖掘技术能够有效加强保险数据分析水平,提高数据利用率的同时让保险决策分析变得更加精确有效,因此保险企业需要组织技术人员积极学习新技术,推动参保人群分析技术的创新优化,也加强保险业务信息化水平,为保险公司的发展带来稳定的支持。
(青岛市即墨区社会劳动保险事业处)
参考文献:
[1]石小娟,方婧.数据挖掘技术在社保审计中的运用[J].纳税,2017:90.
[2]赵丹.数据挖掘技术在社会保险决策分析上的应用[J].信息技术, 2007: 130-132.
[3]蔡艳,胡晓军.数据挖掘技术在社会保险信息分析中的应用浅析[J].今日财富,2009:108-109.
[4]郑秉文. 中国社会保险经办服务体系的现状、问题及改革思路[J]. 中国人口科学,2013,(06):2-16+126.
[5]闵旭蓉. 基于数据挖掘技术的社会保险宏观决策支持系统模型研究[D].河海大学,2006.