互联网金融新信息词检测和基于SVM的金融市场价格预测模型

来源 :北京大学 | 被引量 : 0次 | 上传用户:liongliong467
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息通讯技术和互联网的发展,互联网金融信息对金融市场的影响已经越来越不容忽视。某一个新事件的发生或者是网络上对某支股票的热议都在很大程度上左右着金融实践者们的行为,同时进一步影响着股市变化的趋势。另一方面,在金融市场中,传统的金融市场的影响因素同样发挥着巨大的作用,比如货币供应量和通货膨胀,而如何利用机器学习的方法建立对这些传统影响因素对金融市场价格影响的量化模型,也是本文研究的重点。   本文的内容主要包含两个部分。第一部分,重点研究互联网上的与金融相关信息对真实的金融市场的影响,主要建立起一套对互联网金融领域中出现的新信息词进行检测和跟踪的算法体系,并对该新信息词所代表的事件进行倾向性分析,从而为金融从业人员提供决策支持。第二部分,重点利用SVM算法对金融市场的价格进行预测,其中又包含两个方面。一个是从互联网上的舆论对某支个股价格走势的影响研究,另一个是研究宏观经济层面的流动性和通胀因素,对中国A股市场整体的影响,主要通过对股指的预测来实现。具体来说:   在新信息词的检测方面,本文提出了基于信息熵和均值方差模型的检测方法,改变传统的热点词检测方法只注重当天出现的绝对数量,而忽略其相对程度的缺点。进一步,我们还对这些新信息词背后所代表的事件进行倾向性分析,从而得到该新信息词出现对金融市场的影响是正面还是负面。实验表明,本方法可以有效的检测到金融市场上的重大事件,并且可以对其对市场的影响方向给出明确的答案,为金融从业者了解市场、制定决策提供支持。   在利用SVM研究金融市场价格预测方面,首先通过对A股市场上的一支典型个股万科的研究,通过采集和利用文本倾向性的方法对互联网上出现的相关信息进行褒贬处理,然后得到每日的互联网舆情的倾向,通过SVM的方法对其价格走势进行预测。研究完个股之后,对于整个金融市场走势,通过对过去十年的中国股市场走势及资本流动性指标和通货膨胀系数的研究,同样利用SVM的方法,试图把流动性、通胀与股指走势联系起来,建立起一个可用的模型。两方面最终都通过实验给出了结论。  
其他文献
Web应用离不开数据的持久化。持久化是用来保证数据值的生命周期满足应用程序的要求,具体而言,是将应用程序中的数据值保存到非易失性存储介质(如硬盘、闪存等等)中。传统的Web应
虚拟战场是虚拟现实技术在军事领域的重要应用。计算机技术和图形图像技术的发展带动了虚拟战场技术的长足进步。在新时期部队模拟作战和军事训练中,通过虚拟战场全面掌握战
eDonkey网络是当今流行的P2P文件共享系统之一,近年来对eDonkey网络的研究越来越深入,涉及到资源的分布、用户行为、污染的程度评估与传播、网络流量特征和聚集性等。由于用
随着多处理器、多核、众核技术的广泛应用,虚拟机技术也得到了长足发展。在多核虚拟化环境中,并发运行的虚拟机会由于竞争使用有限的底层缓存和总线带宽等共享资源,而出现严重的
随着互联网技术的飞速发展,新闻网页、电子邮件、博客日志等文本信息的数量急剧增长,信息过载与知识匮乏之间的矛盾日益突出。对海量文本信息高效组织与处理成为当前信息需求
作为信息隐藏的一个重要方向,隐写技术致力于在数字载体中嵌入一定容量的秘密信息,并使得嵌入后的载体能够从视觉感官和隐写分析的角度都具有不可感知性。人类视觉系统具有以
中枢神经系统疾病(CNS disorders)是一组由慢性进行性中枢神经组织退行性变性而引起的疾病总称,主要包括:帕金森病(Parkinsons disease,PD)、脑小血管病(Cerebrovascular disease
随着计算机技术和通信技术的迅速发展,用户需求不断深化与增长,网络规模日益增长,计算机网络应用越来越广泛,用户业务对信息技术的依赖性日益增加。同时,网络病毒、黑客入侵、拒绝
学位
微米木纤维模压加工过程是一个高度复杂的过程,具有非线性、时滞、高维等特性。模压产品具有较高的密度,可以用于装饰装潢,具有较高的应用价值。握钉力是衡量材料力学物理性能的一个重要指标,当材料使用螺钉相连接时,握钉力大小就显的尤其重要。因此,对模压产品的握钉力进行预测成为微米木纤维模压加工研究的重要课题。本文以模压的汽车换挡杆手柄为对象,将机器学习引入到模压产品的握钉力预测上,通过机器学习方法找到一种有
概念是知识表示的核心要素。因此,概念的提取是知识提取中最核心的任务。如何有效地从各类资源中挖掘概念实例是知识提取研究中的一个关键问题。本文分别针对特定领域文本的概