论文部分内容阅读
国际原油价格的分析和预测一直是学界、企业及投资者密切关注的热点问题,目前国内外的研究主要集中在构建基于传统统计数据的分析框架,而很少考虑使用海量互联网数据。随着大数据时代的到来,基于互联网所生成的海量数据的分析及应用逐渐得到学术界和业界的重视。有别于传统统计数据,海量数据大多由互联网用户直接产生,能够一定程度上反映互联网用户对当前热点问题的关注及趋势。大数据的应用给很多传统行业带来变革,这意味着传统的国际原油市场的研究需要重要的理论与方法创新。因此,在大数据时代背景下,研究海量数据在国际原油市场的分析及应用具有重要的理论与现实意义。 本文研究了大数据时代下,基于海量互联网数据分析及建模的理论基础、研究框架及关键模型、技术和方法。在研究框架的指导下,本文构建反映投资者对国际原油市场关注度的衡量指标,探讨投资者关注与国际原油市场上不同类型的投资者交易持仓关系。进一步构建经济计量模型分析投资者关注对国际原油价格及价格波动的影响程度。最后,综合计量经济模型、数据挖掘技术与集成预测等方法提出了基于海量数据的国际原油价格预测模型,并对模型进行综合评价。本文的主要特色及创新工作包括以下几个方面: (1)提出了针对互联网海量数据的指数构建及预测的理论框架,包含对互联网海量数据的获取、分析、合成、预测及评价等部分。以互联网数据作为基础,通过网络文本挖掘、高维特征选择,指数构建方法从海量数据中挖掘并构建综合指数;再将传统的计量经济模型和人工智能技术等综合集成起来,形成一个系统的针对海量数据的分析及预测框架。在这个框架下,可构造多种不同的分析及预测方法。这个研究框架不仅可以将互联网海量数据应用到国际原油市场投资者及原油价格波动的分析及预测中,也可以扩展到其他研究领域如宏观经济及其他能源价格的研究中,为传统领域的分析预测问题提供大数据背景下新的研究方法及技术支持。 (2)构建了基于互联网海量数据的反映国际原油市场的投资者关注指数。在理论研究框架的指导下,采用网络挖掘-特征选择-广义动态因子模型(WM-FS-FHLR)提取互联网搜索关键词,进行特征选择筛选变量,并构建反映互联网关注的“一致指数”。在对投资者关注指数的评价上,首次引入生物信息领域的因果分析方法Partial Directed Coherence(PDC),从而分析投资者关注指数与国际原油现货及期货价格的因果关系,从而对所构建的指数进行综合评价。这一个基于互联网数据所构建的综合指数可用于更全面地衡量原油市场中部分投资者的关注,更及时且准确的表征原油市场的动态变化,所提出的WM-FS-FHLR技术是一个重要的方法创新。 (3)建立计量经济模型分析了投资者关注指数与原油市场投机活动的关系,并讨论了机构投资者和个体投资者的交易持仓与投资者关注指数的差异。数据来源丰富,分别采用美国商品期货交易委员会(Commodity Futures TradingCommission, CFTC)发布的非商业投资者、商业投资者与散户的交易持仓数据、非商业投资者净持仓比例、Workings投机指数、原油库存、原油期货及相关调查数据等构建的衡量指标等多种来源的数据。构建多组VAR模型来研究投资者关注指数对非商业投资者、商业投资者及散户的持仓关系,从而分析投资者关注指数与投机活动的领先性。首次从原油市场投机活动为出发点,构建模型探讨投资者关注指数的“内涵”,以及关注指数对机构及个人投资者持仓的影响,研究成果是对已有文献的重要补充。 (4)提出了基于海量数据的投资者关注对原油价格的“非对称”影响关系的马尔科夫状态转移模型。首先建立单变量时间序列模型分析投资者关注对国际原油价格的影响,并且通过“象限图”更为直观的表明投资者关注指数对国际原油价格的影响并不是一致的,且该影响与原油价格本身的趋势相关。进一步,构建了两状态下的马尔科夫状态转移模型研究投资者关注对国际原油价格的影响,实证结果表明,投资者关注对原油价格的影响在原油价格上升和下降两个不同的阶段表现是不对称的,并且通过引入其他解释变量和改变样本区间等方法对研究结果进行稳健性检验。本文所提出的投资者关注对价格的非对称影响关系模型可扩展到其他研究领域如宏观经济及金融市场中,从而探讨在不同经济周期阶段(如繁荣、衰退、萧条、复苏)中,基于互联网的海量数据对于经济及金融指标的影响,是重要的研究方法及研究成果创新。 (5)建立了投资者关注与国际原油价格收益及波动关系的EGARCH模型。首先计算原油价格收益及其波动序列,并建立包含投资者关注与原油价格收益的VAR模型,并通过分析VAR模型的脉冲响应函数研究了投资者关注与原油价格收益序列之间的相互影响方向及幅度的不同。在价格波动研究方面,通过建立EGARCH模型研究投资者关注对原油价格波动的关系,着重探讨了投资者关注指数对国际原油市场价格收益及波动的影响程度,以及投资者关注指数是否会对价格波动产生不对称影响。这一研究成果为后续原油价格波动率的分析及预测提供新的且重要的数据及模型支撑。 (6)提出了基于海量数据的国际原油价格集成预测模型。通过集成时间序列模型、多元回归模型、和具有不同核函数的支持向量回归模型等方法研究如何在原有数据的基础上,通过引入海量数据构建的投资者关注来提高国际原油价格预测精度,通过样本外滚动预测等方法综合评价该方法的预测精度,并探讨了该框架在其他研究问题中的可扩展性等。本文所提出的基于海量数据的预测模型为传统原油价格预测引入新的数据,并为更及时和准确的原油价格预测提供多种方法和技术。 综上所述,本文采用互联网的海量数据构建原油市场的投资者关注度,提出了基于海量数据研究的分析和预测框架,并对投资者关注与不同类型的投资者交易持仓、国际原油价格及波动关系进行深入探讨。本文所研究成果为已有的国际原油价格的分析及预测贡献有价值的结论。本文的研究紧扣大数据时代的研究热点趋势,不仅分析了互联网生成的海量数据与国际原油市场的关系,而且对于原油市场价格分析、投资决策具有指导意义。本文所提出的研究框架对其他研究领域如宏观经济和其他能源行业的分析及价格预测也具有重要的借鉴意义。