基于Spark的快递申诉业务数据分析系统研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:paradoxfxx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的发展及我国GDP和对外进出口货物量的持续增长,快递业飞速发展。2018年,全国快递服务企业业务量累计完成507.1亿件,同比增长26.6%;但快递途中由于多方面的问题,导致用户延迟收件或对过程服务不满意。随着快递服务监管逐渐完善,越来越多的用户通过邮政申诉维护自己权益,快递业投诉量呈现上升趋势。针对目前邮政行业申诉数据量越来越大、人工处理效率低、实名制推广等问题,本研究对申诉业务相关数据进行大量数据分析,同时基于机器学习算法进行深入挖掘,并研发快递申诉业务数据分析系统以满足用户需求。该研究有助于提高申诉业务处理效率,为调整监管政策提供参考意见,具有一定的实用意义。本课题的研究点大致包含四个部分。1、申诉文本分类:申诉文本是用户在申诉网站中描写申述理由,请求重新处理对应事件而生成的文本。针对申诉数据含有强烈不满情绪及语法句法错误多的问题,本研究提出一个基于字符级卷积神经网络的申诉文本分类模型。实验证明研究提出的模型在中英文申诉数据上均可以达到非常好的效果。2、邮政服务时限预测:快件运送时限是快递服务非常重要的指标,而用户申诉的众多原因中,近40%都与延误相关。延误分析对降低用户申诉率有着十分重要的作用。同时考虑到邮政数据规模庞大的现状,本研究提出基于申诉面单状态数据的邮政服务时限分析模型来解决延误预测问题。3、申诉姓名合理性分析:邮政局响应国家实名制需求,已逐步进行在寄递过程中采用实名制。申诉部门即将采用实名制申诉制度,在接入公安数据之前,本研究制定了姓名合理性校验规则,用于初步判定是否为真实姓名。4、快递申诉业务数据分析系统:上述三个研究点均是基于算法或规则对申诉文本进行分析,分析结果可作为申诉业务数据分析系统的理论基础。为降低申诉业务相关用户数据分析难度,提高申诉处理效率,本研究点综合申诉用户需求,并结合现有并行计算框架的基础上,进行申诉业务数据分析系统的研究与实现。
其他文献
骨和含钙组织脱钙法是影响临床病理检查时间和效果的一个较为重要的环节.以前种种脱钙技术时间均较长,组织细胞结构很难保持完整清晰,从而影响病理学的诊断和研究,也难以保证
新课改后,小学历史课停止开设,历史内容主要纳入品德与社会。学生主要通过品德与社会课学习了解中国和世界历史,培养爱国意识、国际意识和良好的道德品质等核心素养。笔者以
东晋赏物模式的物之殊相、主体赏玩及人生感悟,这三个方面构成为山水诗写作主流范式的基本要素,此种主流范式经由谢灵运的诗歌而得以完全确立。谢灵运以其高妙的语言文字手段
目的讨论精细化护理干预对儿童预防接种效果的影响。方法于2017年7月至2018年8月,选取160例来我院接受疫苗接种的儿童作为此次研究对象,按疫苗接种时间随机将这些儿童分为常
<正>今年以来,国网招远市供电公司(简称招远公司)认真落实党建、宣传等专业会议部署,突出地域特色、实践拓展,扎实推进服务队标准化建设、规范化管理、品牌化传播,树立了彩虹
近年来,随着公安部的命案必破在基层形成共识,客观上形成了保证打击的高压常态,命案的发案呈逐年下降趋势,而非正常死亡案件却一直呈高发状态。基层法医目前面对的最大挑战,
近年来,企业定制移动学习专用APP越来越受到关注,成为当前企业培训的一种趋势,有效设计并合理运用移动学习应用(Application,APP)可以使企业培训变得快捷高效。然而移动学习APP
目的:探讨知-信-行干预对职业人群职业病防控认知度及职业病发生率的影响。方法:选取2014年10月~2015年9月在我院体检的某工厂职业人员220名,将其随机等分为观察组和对照组,
经营风险的保险行业,自身也面临着各类风险。如何通过风险管理制度、工作机制、技术创新,形成保险公司有效的全面风险管理体系,系统防范和化解自身的经营风险是我国保险行业亟待
<正>适应社会主义市场经济发展需要,进一步推进完善省以下财政体制,增强基础政府提供公共服务的能力,财政部建立了县级基本财力保障机制。实施三年来,县级政府"保工资、保运