论文部分内容阅读
本文研究如何提高开放数据质量以更好地满足用户的应用需求。先分析用户需求匹配的行为过程,以北京开放数据门户网站的个体数据集为基本研究对象,选取浏览次数、下载次数和下载浏览比作为外部行为结果指标;然后分析外部指标与数据集的主题、元数据说明、及时性,以及数据表列数、行数等内在质量指标的可能的正相关关系;从相关分析中发现极端不符合正相关的异常数据集,联系这些数据集的用户选择情景深入讨论,提出针对这些异常数据集的质量提升建议.