数据挖掘技术在社会保险决策分析上的应用

来源 :商业文化 | 被引量 : 0次 | 上传用户:wufato
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  数据挖掘是数据库技术开发的成果,在当前越来越多领域中获得了普遍应用,最主要的优势便是数据的价值分析,运用数据挖掘工具来深度挖掘信息资源的利用价值。对于社会保险决策分析来说,数据挖掘技术应用方面的研究仍然不够全面,在各种专著中大多仅涉及社会保障部或劳动部等。以社会保险决策分析的现状来看,很多信息数据存在着浪费的现象,数据挖掘技术的合理运用则可以帮助工作人员在海量数据中挖掘潜在的价值和规律,通过多种数据挖掘方法来实现数据资源的深度利用,为社会保险决策分析提供可靠的依据。本文主要围绕社会保险决策分析展开论述,探讨了数据挖掘技术的应用对策。
  近年来互联网技术的快速发展使得计算机网络的功能性也越来越多元化,各地“金保工程”水保险管理信息系统为人们办理有关的养老保险缴费和变更等业务,利用计算机系统将养老、医疗、生育等社会保障信息传输到省级集中式核心数据库。但怎样才能在社会保险的多个险种参保人员数据中分析出问题数据,为社会保险基金监管工作提供参考则成了当下需要重点探讨和解决的问题,以往的信息数据管理模式随着当前社会保障信息数量的快速累积也显得力不从心,效率难以达到现实要求。对此数据挖掘技术的应用使得这一现状有了新的突破,为社会保险基金监管中的决策分析工作带来了更加充足且真实的数据支持。

数据挖掘技术介绍


  人工智能技术和数据库技术是近几年的热门研究领域,而数据挖掘技术则是这两项技术下的产物,也属于计算机科学技术,计算机技术的快速发展以及普及对数据挖掘技术的产生和推广来说具有先决性作用。数据挖掘是在大量数据之中提取信息价值的技术手段,利用灵活的数据挖掘和分析算法,在目标数据中建立模型,以人工智能技术作为支持,但仅借用人工智能中较为成熟的算法和技术手段,例如决策树和人工神经网络等,问题的复杂度和难度相较于人工智能来说耕地。数据挖掘技术的应用方法也不止一种,应用较为广泛的有序列模式分析、关联分析、分类分析等,具体原理介绍如下:1.关联分析。管理分析主要通过关联规则来实现数据的挖掘,关联规则指的是事物间存在的规律知识模式,关联分析主旨在于进一步找出数据之间潜在的关系和规律。2.序列模式分析。序列模式分析和关联分析的原理并没有太大差异,结合数据存在的关联性和时间性特征,为了解序列模式,需要了解事件发生与否,并且找出事件的产生时间,主旨仍然是找出数据间潜在的关系和规律,但相比之下序列模式分析更加关注数据与数据之间是否存在因果关系。3.分类分析。分类分析指的是分类示例数据库中的数据,针对不同的数据进行描述,建立对应的分析模型或挖掘分类的规律,将数据集中的数据映射于某一既定的类中,输入集是一组记录集合与多个标记。4.聚类分析。聚类分析和分类分析具有很大差异,输入集通常为一组没有标定的记录,这一期间输入的记录并没有任飞处理,分析的主旨则是结合已知的规律进行记录集合的划分,让不同的组具有更大的区别,而组内的区别则尽量降低。

数据挖掘技术在社会保险决策分析中的应用方式


  结合数据挖掘技术的基本特征,数据挖掘技术在社会保险决策分析中的应用能够在社保对象分析、社保基金管理、社保决策管理等方面发挥良好的作用效果,而数据挖掘技术的应用方式主要有以下几点:
  通过聚类分析法分析参保群体类别
  目前,数据处理技术的不断进步,功能性和便利性都有了进一步增强,成了社会保险基金管理工作的开展工具之一,这也代表社会保险机构可以运用数据处理和挖掘等方式来深入了解参保人群,根据参保人群的基本特征和需求进行准确了解,提高服务水平,也让社会保险决策更加契合更多参保人群。
  分析参保人群基本背景
  对于社会保险决策分析工作来说,掌握参保人群的背景资料能够帮助工作人员分析参保对象,进一步完善或调整社会保障策略。而数据挖掘技术最主要的优势便是在海量数据信息中找到对社会保险决策分析有用的信息数据,在提高信息处理效率的同时也为社会保险决策分析带来了更加可靠的支持。
  分析参保人员信用
  分析参保人员的信用信息有助于针对参保人群根据信用情况进行等级划分,对于社会保险机构的决策分析以及管理工作来说具有重大意义,针对不同信用等級的参保人员选择不同的监督管理方式。数据挖掘技术能够在历史信息中分析参保人员的信用记录,从而准确划分信用等级。
  数据资源的挖掘与共享
  数据挖掘技术的应用对于数据收集工作具有更加严格的工作要求,这对于社会保险数据的收集及整合工作来说也带来了一定压力,为进一步提高社会保险机构的服务水平,实现精准化服务,便需要将数据库平台资源一同整合,实现资源利用率的最大化,更有利于数据的快速分析和共享,节约成本投入的同时也改善数据资源的利用率。

数据挖掘技术在社会保险决策分析中的应用过程


  某省金保工程社会保险管理信息系统于1996年建立并发展,互联网技术的应用使得本地域访问社会保险信息数据能够被域网中所有的劳动保障机构访问和管控。该系统属于信息资源系统,最主要的特征便是开发了公共空间,能够让工作人员进行收据信息的读取。同时也是一种独特的管理模式,不同的社会保险服务站用户能够利用核心数据平台的网络快速为参保人处理保险业务,工作效率与质量都有了明显提高。
  明确问题类型
  在遭遇具体的应用问题时,需要找到问题的类型,之后按照不同类型问题选择对应的处理方法。如在进行参保目标的信用分析过程中,便需要针对参保目标信用分析问题进行分类,若这一问题不能通过数据挖掘工具直接解决,则需要选择其他更适合的办法来执行。
  选择数据挖掘技术
  在了解问题所属的类型之后,便可以根据问题的具体类型选择合理的数据挖掘技术。还是以参保目标信用分析问题为例,在找到任务主要分形后可以选择几种技术手段来解决,如人工神经网络和遗传算法技术等。在完成问题分类和技术选择后,还可以根据不同类的信用等级以及问题预测来选择数据挖掘技术与对应的工具,预测未来可能会对性能及可靠性带来影响的因素,确保技术和工具选择的有效性。   数据预处理
  在数据处理过程中可能会出现脏数据的现象,原因基本在于输入错误、编码不一致、重复记录等,數据挖掘的预处理是生成事务模式与有效审计的关键。首先需要对初始数据采集进行校验,有关的技术有一次性采集和数据提取等。在现有数据信息的基础上,数据的质量及数量都可能会对数据挖掘的整体效果带来影响,对此需要在大量的参保数据中徐州那好和分析问题相关的样本数据子集,进而控制数据处理量。但这一过程中也要确保样本子集具有一定的代表性特征,之后便可以对数据进行预处理和分析,对存在的问题进行量化分析。最后结合问题解决的需要来调整数据,如数据的组合和删减等操作,对问题的状态进行描述。
  构建模型
  在完成数据挖掘技术的选择以及数据预处理后,便可以进行模型构建操作,这也是数据挖掘技术应用过程中的重要环节。技术方案选择的不同也会对模型带来影响,模型结果的可理解性也具有不同。如通过神经网络技术而生成的结果相比于其他方法来说理解难度较大。此外,模型结果的分析与描述也是至关重要的步骤,若描述不合理也会出现误导问题。
  证实与评价
  经过上述几个环节后,可以得出分析结果及模型,这也是对问题的多角度描述。这是还要对分析结果进行验证与评价,才能得出可用的决策信息。可以选择的方法也具有一定不同,可以选择用来建立模型的样本数据进行检验,也可以寻找另一批数据来完成检验,还可以在运作过程中取出新的数据进行检验。

结 语


  随着社会经济的快速发展,保险业务对于人们的生活来说具有重大意义,而为了全面推进社会保险决策分析业务的发展和完善,则需要引进现代化的技术手段来进行优化。数据挖掘技术能够有效加强保险数据分析水平,提高数据利用率的同时让保险决策分析变得更加精确有效,因此保险企业需要组织技术人员积极学习新技术,推动参保人群分析技术的创新优化,也加强保险业务信息化水平,为保险公司的发展带来稳定的支持。
  (青岛市即墨区社会劳动保险事业处)
  参考文献:
  [1]石小娟,方婧.数据挖掘技术在社保审计中的运用[J].纳税,2017:90.
  [2]赵丹.数据挖掘技术在社会保险决策分析上的应用[J].信息技术, 2007: 130-132.
  [3]蔡艳,胡晓军.数据挖掘技术在社会保险信息分析中的应用浅析[J].今日财富,2009:108-109.
  [4]郑秉文. 中国社会保险经办服务体系的现状、问题及改革思路[J]. 中国人口科学,2013,(06):2-16+126.
  [5]闵旭蓉. 基于数据挖掘技术的社会保险宏观决策支持系统模型研究[D].河海大学,2006.
其他文献
随着跨境电商平台数字化日渐兴起,数字贸易将成为中国国际贸易发展的未来趋势。论文以阿里巴巴国际站为研究对象,首先分析跨境电商平台数字贸易模式发展现状,其次探究阿里巴巴国际站数字贸易模式,最后基于广州市中小型企业跨境电商发展现状,分析跨境电商平台数字贸易模式对广州市中小企业竞争力提升带来的影响,并将广州市中小企业竞争力的评价体系构建引入其跨境电商发展中,为广州市中小型企业核心竞争力的提升提供了踏实可行的建议。
基于欧拉梁理论推导了两自由度梁的常规态型近场动力学(Peridynamics,PD)模型,并提出一种新的自由边界条件施加方法,对不同边界条件的PD梁进行了模态分析,与局部梁的有限元结果进行了对比,验证了模型的收敛性,分析了PD非局部参数对固有频率的影响.结果表明,当近场作用域内物质点密度较小时,PD梁模型非局部性较弱,与局部梁的有限元结果接近,随着物质点密度逐渐增大,非局部作用增强,PD梁的固有频率逐渐降低;当尺度参数趋于零时,PD梁的固有频率收敛到局部梁的有限元解,PD梁退化为局部梁.研究表明,论文提出
BACKGROUND The microsatellite instability(MSI)test and immunohistochemistry(IHC)are widely used to screen DNA mismatch repair(MMR)deficiency in sporadic colorectal cancer(CRC).For IHC,a two-antibody panel of MLH1 and MSH2 or four-antibody panel of MLH1,MS
学区房价格上涨过快已经成为当前社会关注的焦点问题。本文在分析发达国家学区房概况与发展经验的基础上,系统阐述了国内主要城市学区房政策的四种典型模式及其效果,进而提出通过“限购、限时、限售”等限制性措施严防学区房“空转炒作”,以及通过实施教育资源均衡化、生源质量均衡化、住房租售同权等长效性措施扩大学区房覆盖面,削弱学区房的流动性、确定性,降低其溢价率,从而使学区房逐步实现功能回归与价格回归,并最终达成“有学区但无学区房”的目标。
目的探讨身体质量指数(BMI)作为广西苗族成人肥胖评价标准的准确性,计算适合苗族成人肥胖评价标准的BMI界值,为苗族成人肥胖的防治工作提供可靠的参考界值。方法采用横断面研究的方法,以广西融水苗族自治县的苗族村寨中18岁以上常驻居民作为研究对象,测量其体成分。以体脂率(PBF)标准作为肥胖的“金标准”,以中国成人肥胖的BMI标准作为筛检阳性标准,对BMI标准的准确性进行评价。ROC曲线分析确定适合作为苗族成人肥胖的最适BMI界值。结果BMI的检出率低于PBF(10.3%VS 19.0%,χ2
将结合面接触点拓展为椭圆形,基于KE有限元模型,类比球形微凸体在弹塑性接触变形阶段法向载荷、接触面积以及变形量之间的关系,采用代入法得到了表征椭圆抛物面形微凸体弹塑性接触变形机制的对应关系式.假设结合面接触点离心率分布与接触点面积分布相互独立,根据概率论以及接触点的面积大小分布函数,获得了关于结合面接触点面积与离心率的二维联合分布密度函数,进而依据三维各向异性分形几何理论建立了包含微凸体完全弹性、弹塑性以及完全塑性三种变形机制的结合面法向接触刚度分形模型.所建模型理论刚度与实验数据的对比结果,表明了模型的
“五十六个星座,五十六枝花,五十六族兄弟姐妹是一家……爱我中华,中华雄姿英发……”这是乔羽为《爱我中华》所作的词。今年是中国共产党成立100周年,虽然我只是一名六年级的学生,但是此刻我也想拿起笔来表达我对祖国的爱,就从电影《地道战》来讲起吧!
目的探究三氯生(TCS)对小鼠的免疫功能的影响。方法选用40只雌雄昆明小鼠(25±2)g,根据体重比分为5组,每组8只,雌雄各半,分别对应为空白对照(生理盐水)组,二甲基亚砜(dimethyl sulfoxide,DMSO)组,以及浓度分别为59.375mg/kg、118.75mg/kg、237.5mg/kg的三氯生溶液组,每日一次,连续灌胃两周,解剖取其脾脏、胸腺等组织,测定其与体重的相对比值,同时用摘眼球法取外周血,测定其半数溶血数值。结果脾脏指数显示,在雄性小鼠的中浓度组和高浓度组中,与阳性对照组相
社会经济和科技力量的迅猛发展,焕发了新时代的来临,即互联网时代。基于互联网的资源共享化、云端服务化、服务对象化、通信信息化等特点,产生了一种新型处理模式,即众包模式。互联网众包模式的出现和发展给各行各业带来了机遇,但也给现代企业管理带来了挑战。因此,本文将视野聚焦于互联网众包模式对现代企业管理模式创新的启示及具体应用方法,希望为现代企业管理模式的构建有所帮助。  互联网众包一般是指某个公司或机构将
企业之间的文化和管理竞争正逐渐转变为一种以文化软实力、管理模式、组织架构等为基础的文化与管理,符合市场经济发展趋势的企业,才可以在激烈的竞争中占据优势。因此,需要根据当前企业文化创新的重要性、企业所面临的挑战,综合深入地分析、思考企业文化对其产生影响的价值。本文基于企业文化创新,阐述了其对于管理创新的重要影响。在了解市场经济发展的情况下,企业通过适当的运营管理,可以谨慎应对企业的竞争和市场风险,给