大数据环境下的服务发现技术研究及应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户：shabi12345678

【摘要】

：

随着云计算技术和移动互联网的迅猛发展及智能终端的普及，服务的开发、部署、访问及维护成本大幅度降低，海量服务应运而生。同时，用户与服务之间，服务与服务之间，用户与用户之间的

【作者】

：

陈亮

【机构】

：

浙江大学

【出处】

：

浙江大学

【发表日期】

：

2015年期

【关键词】

：

计算机网络服务发现技术数据质量

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着云计算技术和移动互联网的迅猛发展及智能终端的普及，服务的开发、部署、访问及维护成本大幅度降低，海量服务应运而生。同时，用户与服务之间，服务与服务之间，用户与用户之间的交互数据也在井喷式增长，仅以Twitter API服务为例，每天的用户调用纪录达60亿条以上。可以预见的是，服务计算的大数据时代正在到来。　　在服务大数据的新形势下，如何有效地利用与服务相关的多源数据，实现面向海量服务的高效、准确的服务发现，正在成为学术界和产业界共同关注的研究热点。传统的服务计算研究具有规模较小、数据单一、环境静态等局限性，无法应对新形势下“海量服务”、“多元数据”、“复杂网络”等特性对服务发现提出的挑战。本文围绕服务发现中的三大关键问题，包括服务聚类，服务质量预测和服务选择，在大数据环境下展开研究，主要工作与贡献包括如下:　　首先，针对由于数据单一造成的服务聚类准确性不足等问题，分析并引入服务标签数据，提出融合标签数据的服务聚类方法，并发布了业内首个服务标签数据集。针对服务聚类方法，提出基于相似度计算和LDA模型的两种服务聚类算法。针对服务标签数据分布不均、模糊性、宽泛性、甚至恶意性等特点，提出标签推荐和标签排序方法来提高标签数据质量。相关实验证明了标签数据的引入对服务聚类效果的提升，以及本文所提出的服务标签数据处理方法的有效性。　　其次，针对复杂网络环境下的服务质量数据缺失问题，提出一种基于协同过滤的混合服务质量预测方法。通过分析QoS数据集，针对QoS数据标准差过大的特点，提出使用A-Cosine方法来计算服务之间的相似度，从而消除其对服务质量预测的影响;提出QoS数据平滑化处理机制，使用基于聚类的null值初始化方法来提高服务质量预测准确性;提出混合服务质量预测以降低数据稀疏性对预测准确性的影响。同时，提出二阶段近邻选择优化策略来提升预测方法的可扩展性。最后，通过一系列基于真实数据的实验，证明了本文提出的预测方法的准确性。　　最后，针对面向海量服务的基于QoS的服务选择问题，提出了基于Map-Reduce框架的并行Skyline服务选择算法。在并行Skyline服务选择算法的Map过程中，提出基于角度的数据空间分割方法来优化Map过程中的任务分配，并通过理论证明了基于角度的数据空间分割方法的有效性。在并行Skyline服务选择算法的Reduce过程中，提出DoPoLo优化策略及两种算法来提升Reduce阶段的效率。最后基于真实数据和仿真数据，对本文提出的并行skyline服务选择方法及相应的多种优化算法进行了验证。

其他文献

多关系数据分类算法研究

多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一。传统的数据挖掘方法只能完成单一关系中的模式发现，多关系数据挖掘能够从复杂的结构化数据中发现涉及多个关系的复

学位

数据挖掘空间数据挖掘多关系数据挖掘关系数据库多关系决策树

免疫遗传算法在分类中的研究及应用

人工免疫系统作为计算智能研究的一个崭新分支，已在数据挖掘、机器学习、自动控制、故障诊断等诸多领域显示出强大的信息处理和问题求解能力以及广阔的研究前景。将人工免疫算

学位

人工免疫系统人工免疫系统免疫遗传算法免疫遗传算法数据挖掘数据挖掘分类分类

软件构件组装技术研究

随着计算机技术的快速发辰,人类社会对计算机软件的需求不断增加。在开发软件的实践中,研究人员逐渐认识到,要真正实现软件的工业化生产并达到软件产业发展所需要的软件生产

学位

软件构件构件组装行为相容可靠性移动Agent网络环境

基于移动Agent的Web服务组合

使用工作流管理技术整合Web服务,提供了一个跨平台的、语言无关的、便于复用的柔性计算环境,能满足现代企业提出的敏捷制造要求,是现在研究的热点。本文在对Web服务及Web服务

学位

动态Agent移动Agent工作流技术Web服务企业应用集成

一个基于Eclipse的面向对象双向工程工具的设计与实现

随着软件规模日益增大，出现了支持专注于处理生命周期中每个阶段最高风险的迭代方法。在这种多次迭代的过程中，必然多次涉及到从模型到代码的生成、从代码到模型的逆向生成、模

学位

程序理解双向工程同步机制EclipseJDTGEF

基于互联网的模糊数据挖掘技术的研究与应用

互联网上丰富、广泛的信息已成为人们最重要的信息来源之一。如何帮助用户快速、准确地查找网上有用信息,是一个非常有意义的问题,具有很高的实用价值,己经成为近年来的研究

学位

数据挖掘文本分类模糊算法分类搜索

基于身份的PKI系统研究

基于身份的公钥密码体制(ID-PKC)是公钥密码体制的一个重要分支，其突出的特点在于公钥可以是事先选定的任意字符串，比如身份信息。这个特点使得在此基础上构建的基于身份的PKI(

学位

公钥密码体制PKI系统密钥隔离密码方案密钥管理身份认证网格安全

复杂条件下PDF417条码识别研究

条码技术自问世30多年来发展迅速，在各个行业得到广泛的应用，是目前最经济、实用的一种自动识别技术。随着信息化和全球化的进程，人们对条形码的需要层次不断提高，尤其是对单个条

学位

二维条码二维条码PDF417PDF417识别算法识别算法码字译码码字译码

面向手机的中文文本信息分类技术的研究

近年来，随着通信设备和技术的发展，手机短信服务为人们提供了更多的信息，同时也为形形色色的不良信息提供了藏污纳垢的便捷场所。因此，实现对手机短信进行自动分类，可以帮助人们识

学位

中文文本分类中文文本分类手机短信分类手机短信分类N-GramN-Gram最小类过滤最小类过滤贝叶斯分类器贝叶斯分类器

基于产生式的工作流模型分析技术研究

工作流技术是当前非常活跃的研究领域之一，随着工作流系统在企业中应用的深入，业务流程日趋复杂和庞大，造成基于工作流的应用系统的设计成本加大、风险性提高。因此，如何在流程模

学位

工作流模型结构形式化方法产生式属性验证框架可扩展性

大数据环境下的服务发现技术研究及应用

其他学术论文