基于数据挖掘的开放式基金投资决策支持系统设计与实现

来源 :中国人民大学 | 被引量 : 0次 | 上传用户:gaolaoshi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是近些年来发展起来的新技术,通过数据挖掘,人们可以发现数据背后隐藏的有价值的、潜在的知识,为科学地进行各种商业决策提供强有力的支持。当今,数据挖掘已发展成一门跨越多领域的学科,在金融领域的应用也逐渐成为研究者关注的热点。本文将主要关注数据挖掘在开放式基金投资中的应用研究,用先进的技术解决实际问题,拓展数据挖掘的行业应用。  中国的开放式基金在国家政策大力支持下,发行的规模逐年增大,基金投资者迅猛增长。如何能够准确地判断基金优劣和预测发展走势一直备受人们的关注。建立一个准确度比较高的基金分析模型及其应用系统,对于基金投资者和基金管理机构都具有重要的实用价值。  基金与股票不同,它是多种股票或证券投资的组合体,其资产配置、市场大势表现、基金经理的选股与择时能力,直接影响到基金净值的变化。因而,本研究从基金历史净值入手,结合股指、债券指数的变化趋势,使用聚类及神经网络等数据挖掘算法,能够客观评价出基金的风格类型,推断其未来的收益状况及潜在的风险。  本文的基本内容分为五章,第一章绪论部分对本课题的研究背景、国内外研究情况、论文创新点和结构作了简要的介绍。第二章介绍了数据挖掘研究的相关背景及基本理论,为本文打下理论铺垫。第三章对开放式基金绩效评价相关知识作了简要的阐述,从开放式基金的特点、风格形成和评价要素等几个方面进行了分析,引出了本课题的开发需求及设计思路。鉴于本课题需要运用一些具体挖掘技术,在第四章还特地对k-均值聚类算法、BP(Back propagation)神经网络算法和遗传算法分别作了论述。第五章是本文最具价值和创新的部分,在这部分对决策系统的设计与实现作了详细的论述,其研究工作归纳起来主要有以下几个方面:  (1)数据预处理工作中,考虑到挖掘数据来自多个异构数据源,极易受到噪声、丢失数据和不一致数据的侵扰。所以,对收集来的数据进行整合、清洗、构建和选择等预处理操作,消除了由于基金和证券股指等数据来源分散、格式不规范所带来的不完整和不一致,提高了数据质量,为数据挖掘提供了可靠的数据源;  (2)风格分析模块的设计中,结合开放式基金风格形成的特点和曼哈顿距离算法原理,为基金中的收益、风险、收益增长与证券指数变化相似度和收益超越证券市场能力等基本要素,设计了8个计算公式并分别进行运算。然后,再借助k-均值聚类算法对这8类数据分别进行分组,得到了每只基金风格要素所处的相对值,并通过表格和图形直观地向用户展现;  (3)收益与风险预测模块设计中,借鉴了基于遗传算法的神经网络算法,并对基于遗传算法的神经网络进行了改进,在BP算法训练网络出现收敛缓慢时启用遗传算法优化网络训练参数,把优化的结果作为BP算法的初始值再用BP算法训练网络交替运行,直到达到问题要求的精度。本文中的实验数据证明,该方法能够在提高预测效率的基础上显著降低预测误差,并且提高预测序列与实际序列的相似形,较好实现了对基金收益与风险的短期预测;  (4)组合投资优化模块设计中,对基金组合投资的特点进行了分析,运用遗传算法的全局寻优对智能组合问题进行研究。根据用户组合投资需同时满足收益最大化、风险分散化和组成比例灵活化等要求,引入惩罚函数、部分交叉匹配等算法,使传统的遗传算法具备了多目标寻优的能力。实验结果表明该方法效率较高且能够充分满足用户决策时的多样化需求。  上述开放式基金决策支持系统采用B/S(浏览器/服务器)模式构建,便于系统推广与应用。并以C# ASP.NET2.0为前台开发工具,MS SQL server2005为后台数据库进行开发。本文还图文并茂的介绍了几大功能模块运行的实证效果,其结果充分表明了本决策系统成功实现了预期目标,能够为投资者科学决策提供有效帮助,具有较好的应用前景。
其他文献
基于模型的软件测试是基于软件的需求分析与设计模型,提取测试信息,生成一套测试用例的技术。针对软件的不同特征和不同目的,研究人员提出过多种软件开发与测试模型。随着基于UM
伴随着互联网的发展和大数据时代的到来,网络知识库应用越来越得到用户的关注,比如智能问答系统,Google的知识图谱,百度知识图谱等,这些应用都是由强大的知识库为支撑的。然而基于
CMM和敏捷开发是软件过程改进领域两个代表性理论,分别代表着软件过程改进的“重量级”和“轻量级”思想。然而,无论是CMM还是敏捷,都尺有所短、寸有所长,不能解决软件生产领域的
随着人们对知识表示、信息组织和复用以及为用户提供有效服务的需求越来越强烈,本体作为一种能在语义和知识层次上描述信息系统的概念模型建模工具,自提出以来就引起了国内外众
数据挖掘是当今人工智能和数据库研究方面最富活力的领域。数据挖掘是指从大量的数据中发现潜在的、有用的知识的过程。关联规则数据挖掘则是数据挖掘的一个主要研究内容。而
随着搜索引擎技术的深入发展,垂直搜索引擎在人们的个性化需求下应运而生。然而,作为垂直搜索引擎核心部分的主题蜘蛛在主题搜索方面却存在着效率不高、搜索页面信息范围受限、
普适计算(Ubiquitous Computing)创造了计算机计算的特殊阶段。这个阶段之所以特殊,是因为在信息空间与物理空间的融合中计算机自身在消亡,取而代之的是无线传感器网络。为了整
计算机辅助教学的一个重要应用是计算机辅助测验。自动组卷是计算机辅助测验的重要组成部分。组卷模型的设计必须遵循科学的教育测量理论,才能保证输出的试卷具有较高质量。在
随着计算机技术的发展,用计算机进行人群紧急疏散模拟成了近年来在计算机图形学和虚拟现实领域兴起的一个研究热点。这种运用计算机进行的人群紧急疏散行为模拟和研究,能在各种
在过去的二十年中,互联网取得了巨大的成功。互联网的成功,很大程度上归功于它简单易行的通信模式:一个节点只需要按照指定的协议发送和接收数据包,而不必了解负责传输数据的网络