Pareto分布模拟自相似流量的仿真研究

来源 :科技资讯 | 被引量 : 0次 | 上传用户:lgs0519
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  DOI:10.16661/j.cnki.1672-3791.2017.22.004
  摘 要:大量研究表明,计算机和通信系统都会出现重尾特性。Pareto分布是最具有代表性的重尾分布。许多服从Pareto分布的ON/OFF源叠加以后可以模拟以太网通信量,重尾分布可以用来反映以太网ON/OFF源的真实情况。该文在许多相关研究的基础之上,进一步探讨了关于Pareto分布的一些性质,根据ON/OFF源发包服从Pareto分布的特性,利用Matlab对自相似流量的产生进行了仿真。
  关键词:Pareto分布 自相似流 Matlab仿真
  中图分类号:TP391 文献标识码:A 文章编号:1672-3791(2017)08(a)-0004-02
  互联网业务流量具有长相关、突发性、自相似性、包长度和包地址分布不均匀性等主要特性。传统网络流量大部分使用自回归模型、泊松过程来产生业务流量模型,在这些基础上产生的网络流量,通常在时间轴上只呈现出短相关特性,当时间尺度增大到一定的程度時,网络业务流量呈现出稳定趋势,Pareto分布由于其良好的性质受到了研究者的重视。另外,建立一种参数可调的具有自相似特性的业务模型来进行仿真研究是很有必要的,所以,该文采用了一种参数可调的模型利用Matlab对网络流量的产生进行了仿真,对以后的研究具有一定的积极意义。
  1 自相似过程
  自相似过程是一种随机过程,是指时间或空间特性的改变不影响其统计特性的改变。通常可以有以下几种定义[1]:严格自相似过程、二阶自相似过程、广义的二阶平稳自相似过程和渐进二阶自相似过程。自相似具有伸缩对称性的特性,即线性或非线性变换下的不变性。对分形对象进行放缩或者剪切等操作时,只能改变其外部的表现形式,而表征自相似特性的参数即分形维度是不会发生任何改变的。自相似作为分形的基本特征,指的是复杂系统的整体与部分,一部分与其他部分之间在性质上或者精细结构上所具有的自相似性。
  自相似过程主要有以下几个特点[2]。
  1.1 长相关性
  对于自相似过程,其当前的时间序列与之前的时间序列值有着不可忽视的相关性,即该时间序列是具有长相关特性的。
  1.2 聚集方差衰减缓慢
  自相似过程的聚集过程方差衰减速度比m-1小,而对于短相关过程,其聚集过程的方差衰减速度与m-1相同。
  1.3 赫斯特效应
  对于长相关时间序列来说,其自相关性可以使用赫斯特指数来描述。赫斯特指数表示时间序列的平均、回归或聚集的相关趋势。若赫斯特指数,则,表示在样本中出现极端值的时间较长,也就是所谓的持续性。如果网络流量的突发性可以用这种极端值的持续时间长短来表述,那么就可以用赫斯特指数来描述网络流量的突发性强度。并且这种突发性不会因为聚集而被平滑掉。
  1.4 幂指数特性的谱密度
  将自相似过程放在频域上考虑,因为其具有持续性,所以在低频处的谱密度较大,在频率为0的位置附近,其功率谱密度函数服从幂指数函数。
  2 Pareto分布的定义与性质
  若随机变量T 的密度函数为:
  ,(x≥y) (1)
  那么将T 称为是具有Pareto分布特性的随机变量,记为。其中β代表形状参数或叫做Pareto指数,代表尺度性能参数或叫做门限参数。
  Pareto分布的概率分布函数为[3]:
  (2)
  其中,α为分布的形状参数,β称为分布的位置参数。当时α≤1,服从Pareto分布的随机变量具有无限均值;当α≤2时,服从Pareto分布的随机变量具有无限方差;当时,服从Pareto分布的随机变量具有有限均值以及无穷方差。
  Will linger等人的研究表明:许多服从Pareto分布的随机变量叠加起来的结果就是自相似过程。
  3 源包模型
  在自相似业务流的物理模型中,使用最多的是流叠加法[4]。ON/OFF模型就是模拟大量用户数据源的叠加来产生自相似业务流的过程。原理为:ON/OFF模型具有严格交替的ON周期和OFF周期,并且认为连续的ON周期和OFF周期独立同分布,并且互不相关。当处于ON周期时,数据源以恒定的速率发送数据包;当处于OFF周期时,不发送任何数据包,那么链路实际传输的数据包总数就是M个独立同分布的数据源相叠加而得到的。
  4 仿真系统模型建立
  该文利用Matlab对通过ON/OFF自相似业务流量模型产生的网络流量进行了仿真。仿真模型框图如图1所示。Matlab编程思路如下:首先假设有Nn个信源,然后设置仿真实验中涉及到的一些参数,接下来是信源的发包过程,处于ON状态发包,发包速率为R,发包持续时间服从Pareto分布,处于OFF状态不发包,所以到达的数据包个数就为处于ON状态的信源数与发包速率和每个信源发包持续时间之积。仿真参数设置如下:信源数Nn=500,平均包到达率λ为0.5,其指数分布参数μ=1/λ,Pareto分布函数的参数设置如下:X=0.2,K=1.5,σ=θ=1,发包速率R=10。到达的数据包个数仿真图如图2所示。
  从图2中可以看出,通过Pareto分布模拟出的网络业务流量具有突发性,并且具有长相关特性,而传统的泊松分布只呈现出短相关特性。其次,我们是通过设置参数来进行仿真的,所以我们可以通过改变参数来观察网络流量的变化。
  5 结语
  该文介绍了Pareto分布的性质以及源包到达模型的建立过程,并采用了基于Pareto分布的ON/OFF源,通过Matlab仿真,模拟了网络流量的生成过程。其次,该文是建立了一个参数可调的模型来进行仿真,可以通过改变参数来进行仿真实验,对以后这方面的仿真研究具有一定的积极意义。
  参考文献
  [1] 王晓婷,王忆文,李平.一种自相似网络流量生成器的设计与实现[J].微电子学与计算机,2016(8):54-58.
  [2] 褚立文, 陈俊亮.一個新的自相似业务流在线生成算法[J].北京邮电大学学报,1999,22(1):43-47.
  [3] 程红霞.自相似业务流的预测研究[D].电子科技大学,2006.
  [4] 陈凯.自相似网络流量仿真与性能分析[D].北京交通大学,2009.
其他文献
摘 要:世界知识产权组织对技术的定义:“技术是制造一种产品的系统知识,所采用的一种工艺或提供的一项服务……”工艺是形成成品的方法和过程,服务是一种活动,可见技术是非物质的,是人们对事物的认知,可以传递,却不产生实效。本文采用基础理论推导、典型案例剖析和文献研究相结合的方法挖掘颠覆性技术内涵,总结其概念、作用机理及判别标准,对颠覆性技术产生领域进行了解读,并指出了颠覆性技术在实现颠覆各阶段的实施主体
大学生安全教育是培养大学生全面素质的重要内容,而高校辅导员是开展大学生思想政治教育的主力军,与学生接触最为密切,其独特的身份是其他人无法取代的,在开展大学生安全教育
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
摘 要:随着城市容量的扩大及交通拥挤情形的加剧,人们花费在公共交通出行方面的等待时间日益增多,极大地降低了交通出行的效率。运用智能交通技术,实现公交车运行轨迹及到站时间预测,可以极大方便乘客合理安排出行计划,并节约社会出行总时间。  关键词:公共交通 智能交通技术 出行时间  中图分类号:U491 文献标识码:A 文章编号:1672-3791(2017)03(c)-0023-02  随着社会经济的
伴随着蛋鸡养殖模式的转变,规模化、标准化已经成为养殖的主流,各大养殖场对先进的养殖设备、技术也越来越关注。
2010-2019年的10年间,日本建设机械市场波动明显。2009年,在世界金融危机和经济下滑的冲击下,日本建设机械的销售额只有1.16万亿日元;2010年后日本建设机械业状况有所回升,20
随着我国国民经济水平的不断提升,使得我国现代企业的发展规模越来越大,同样现代企业需要面临的外界环境变得越来越复杂,使得企业在发展过程中受到各种风险的严重影响,然而,
陶澍作为中国清代著名的政治家、改革家,他的历史功绩是多方面的.然而,就其对我国近代历史发展的影响来说,最重要的莫过于对杰出人才的发现和拔擢,而这一切,又是与他的人才思
摘 要:随着三维地震勘探技术在煤田的深入应用,为大型矿井建设,综采工作面的布局、巷道布置与开拓提供了精确细致的地质构造信息,以其高分辨率、高精度的优势查明采区细微地质构造。在吕梁山脉测区,地形复杂,数据采集难度大,为了获取优质的地震数据资料,需要综合考虑地质任务地形地貌以及设备仪器等各项因素,灵活合理地设计三维观测系统。  关键词:三维地震 吕梁山脉 观测系统  中图分类号:P63 文献标识码:A