面向城市规划领域的社交媒体分析方法

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:jsdkhfahdjfk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交媒体的广泛传播和使用,Web2.0时代所集聚的社交媒体大数据使得收集和利用人类活动、言论、思想印记的能力得到前所未有的提高。对于城市规划领域而言,在政策的制定、实施及评估过程中增强公众的参与和反馈能力,能够提升规划领域专家感知社会的能力,及时发现规划中存在的具体问题,并提高规划政策的针对性和科学性。  本文结合自然语言理解、文本挖掘和语义网技术,对社交媒体文本数据进行分析挖掘以提升城市规划领域的社会感知能力。主要工作包括:  第一,构建了社交媒体语义分析框架。为实现社会感知的目的,框架对其功能模块及模块间的交互关系进行了组织定义。框架分为数据层、处理层和输出层,同时包括一个知识库模块,其中处理层集成了主要的自然语言处理技术和文本挖掘技术,前者包括分词、词性标注、依存句法分析等,后者包括话题分析、文档聚类、事件演化分析、情感分析、观点挖掘、基于本体的信息抽取等。框架中每个模块都负责一个具体的功能实现,同时功能模块之间通过灵活的组合达到不同的分析目的,满足不同的应用需求。本文实现了该框架,并针对北京城市规划领域的回龙观专题和基础教育专题相关的10万余条微博数据和10万余条微信公众号文章进行了话题挖掘、情感分类、信息抽取等相关分析,最终得到了回龙观社区热点话题、社区周边道路站点的交通状况、小区建设中存在的具体问题、和北京市172所小学的情感分布结果,对于提升城市规划社会感知能力起到了积极作用。  第二,提出了基于本体的社交媒体分析方法。领域本体为支持社交媒体语义分析在以下几个方面发挥了重要作用:(1)本体作为领域知识库,其中所包含的概念、个体、属性具有语义定义,利用这些知识进行文本的语义标注和信息提取。同时本体中的概念名称、属性名称以及个体名称构成了一个领域词典,用以提升文本分词效果。(2)本体中定义了领域概念之间的语义关联,利用概念间层次包含关系实现对领域相关的话题词汇的聚类,改善了话题分析效果。(3)利用本体包含的领域知识,对信息抽取得到的RDF图进行查询推理,得到更多的、隐含的知识。  本文构建社交媒体分析框架,集成了一系列文本分析技术以实现对数据比较全面和深入的挖掘,该框架与领域本体相结合,实现了对社交媒体的语义分析。将本文框架应用于真实社交媒体数据的分析,切实得到了能够辅助城市规划领域专家感知城市环境的有意义的结果。
其他文献
本论文讨论了几类基于Zakagi-Sugeno(T-S)模糊模型的不确定非线性动态系统的模糊控制问题,利用线性矩阵不等式(LMI)方法和Lyapunov稳定性理论,提出了几种保证闭环系统稳定的
本论文涉及的课题是“基于智能体技术的入侵检测系统体系结构的研究”,提出并深入研究了一个基于智能体技术的入侵检测系统的体系结构,构造一个比较理想的原型系统。本文陈述
并行处理系统是当今计算机科学研究的前沿。互连网络作为并行处理系统的主干,它的性质对整个网络的性能起着决定性作用。新型并行机的研制依赖于对新型互连网络的设计以及对互
数字全息数据存储(digital holographic data storage,DHDS)是一种基于页的光存储技术,由于同时具有高速的数据传输速率、巨大的存储容量和短暂的访问响应时间,极有可能成为
高校研究室不同于常规意义上的软件开发组织,在软件开发过程上有其自身的特点和要求,主要有创新性强造成的变化、修改较多,人员新手多,人员流动大,重技术轻文档等问题。成熟的软件
在计算机科学领域,数据仓库技术代表了计算机技术一个重要的发展方向,与其相关的研究工作引起了人们广泛的关注和重视。数据仓库技术经过二十多年的发展,已经开始在很多领域
随着现代化电器设备的使用,变频设备引入,对电网进行切割,从而产生杂质波,即谐波。谐波恶化了电能质量指标,污染整个电网环境,因而降低了电网的可靠性,其危害不可小视。本课题对于电
本课题来源于四川省青年软件创新工程项目:基于广域网的分布式容错存储平台。研究和开发一种网络容错存储平台软件,主要用于数据的高可靠存储、远程备份和远程灾难恢复。本文
词的特征表示是自然语言处理的一个基础问题,广泛地应用于自然语言处理的各个任务之中,如词性标注、句法分析、依存句法分析、语义分析以及机器翻译等.好的词特征表示可以大大
该论文在对数字图书馆相关技术及数字资源元数据标准的研究基层上,提出并实现了一个基于DC元数据、XML技术的"数字资源管理与服务系统"的应用方案.该论文主要研究工作包括以