论文部分内容阅读
房地产市场景气变动对国民经济发展有着重要影响,也与人们的生活息息相关。住房价格的评估和分析在房地产行业景气监测、银行资产评估、不动产税收政策设计等领域有着日益重要的作用。且现阶段房产评估存在低效率、高成本、主观性强等问题,亟需结合“互联网+大数据”进行行业转型。本文设计一个住房智能估价模型体系,对住房价格的影响机制进行探究分析并结合机器学习方法预测,给我国建立科学高效的房产评估体系以启示。 本文选取北京市二手房价格为研究对象,并结合房产的物理属性、区位属性、行业景气和网络搜索数据,采用分位数回归和最优子集回归对二手房价格的影响因素进行探究,并基于影响因素的结果,采用支持向量回归和高斯过程回归模型进行预测。此外,基于分位数回归结果的启示,本文开创性的提出了分区间预测的方法。分区间预测首先需要对样本进行区间分类,其次根据区间分类的结果选择相应区间的模型进行预测。区间分类采用神经网络,K-最邻近和支持向量分类机,预测模型依旧采用支持向量回归和高斯过程回归模型。为了检验方法的效果最后进行实证分析。 结果表明,行业景气和包含用户关注信息的网络搜索数据是二手房价格显著的影响因素。不同的因素对于不同价格分布下的房屋影响存在差异,如:小区地段对高价位房屋影响更大,新房市场对低价位二手房冲击更大,地铁覆盖对价格影响呈不对称的n形特征,而小区周边的医院数目对不同分位数房价的影响呈现M型特征等。预测结果表明,影响因素中包含的非线性信息不能被特征价格模型所解释,支持向量回归模型的预测效果最好,在±15%的容错率下预测精度达到62.7%,比特征价格模型提高了19.4%。分区间模型能更加精准地描述数据特征,无论是高斯过程回归还是支持向量回归预测效果比全样本模型有显著的提高,尤其是特征明显的低价位和高价位区间。此外,样本区间分类的准确度对分区间预测效果有显著的影响。 与已有文献相比本文的创新点在于以下四点,第一,本文首次将分位数回归的方法应用在我国北京市二手房市场,在影响因素探究中可以挖掘价格决定机制的结构性差异,弥补特征价格模型的缺陷,给研究提供了一个全新的视角,并首次结合分位数回归的结果进行实证预测;第二,开创性的将来源于互联网的媒体关注和用户关注信息纳入住房估价体系,建立小区舆论热度指标,该指标与相应的二手房价格显著相关,能够明显提高二手房价格模型的拟合精度并提高预测精度;第三,本文开创性将经济因素加入影响指标的体系中,考虑了中观行业层面和宏观经济层面,在经济因素对价格产生影响的阶段能够刻画经济因素的作用机制;第四,设计并初步实现了一个住房智能估价模型体系包含样本抽样、模型选取、参数优化、预测方法等环节,可以全面、准确、高效、智能的进行房产评估,并提出了全新的分区间预测方法,分区间方法能精确刻画不同水平下样本的特征,能显著提高预测的精度,对于住房估价这种复杂问题有明显优势。