【摘 要】
:
为了快速地获取到海量微博中的数据,根据微博网页的特点,提出了一种基于Python爬虫程序设计方法。通过模拟登录新浪微博,实时抓取微博中指定用户的微博正文等内容;该工具利用
论文部分内容阅读
为了快速地获取到海量微博中的数据,根据微博网页的特点,提出了一种基于Python爬虫程序设计方法。通过模拟登录新浪微博,实时抓取微博中指定用户的微博正文等内容;该工具利用关键词匹配技术,匹配符合规定条件的微博,并抓取相关内容;最后使用该工具对部分微博数据作了一个关于雾霾问题的分析。实验结果表明:本程序具有针对性强、数据采集速度快、易嵌入开发、简单等优点,为不善于编程的研究者提供了快速获取微博的方法,有利于对微博的后续数据挖掘研究。
其他文献
基于变结构控制理论 ,提出了一种垂直命中目标的导引律。该导引律在引入理想的视线角基础上 ,所设计的切换函数不仅保证脱靶量为零 ,而且能同时达到垂直命中目标的目的。数字
我国电源装备市场竞争激烈,国内电源装备厂家直接面临美、日、欧各国公司的竞争,研究和发展基于嵌入式系统的电源装备是提高我国电源装备核心技术的重要手段。本论文以“面向
移动互联网、移动支付的广泛应用,使民众的消费习惯发生了改变,这对传统险企的产品销售模式产生了巨大的冲击;随着互联网巨头对保险行业的涉足,以及我国保险市场对外资险企的开放,使得我国保险市场面临前所未有的转型危机,如何利用移动互联网的便利抢占市场,成为许多保险从业者争相研究的热点问题。本文采用PEST和SWOT分析方法对中国人寿财产保险股份有限公司陕西分公司(以下简称“国寿财险陕西分公司”)进行了全面
"百工课程"是我校开展的具有鲜明特色的学习校本课程。百工课程的教学以陶行知"做中学"为基本理念,践行"学而时习之,不亦说乎",提供学生"学""做"互参、快乐成长的个性化学习
医学成像系统用来扫描病人为疾病诊断和辅助治疗获取有价值的信息。理想的扫描仪具有足够的灵敏度来发现任何早期阶段的异常组织。但是由于医学影像图像分辨率的限制,常常导
高等职业教育的快速发展,促进了高等职业院校教学模式的改革与创新。潍坊工商职业学院畜牧兽医专业在人才培养模式上已初步形成了具有高等职业教育特色的教学体系,成功地探索了
图片已成为在线评论的主流形式,对消费者决策起到重要帮助。多数学者围绕图片评论数量特征进行分析,而没有对图片内容进行深入考察。本文以精细加工可能性模型(Elaboration L
口译的流利和准确性之间关系的协调;对来源语的删略处理得当否,是对口译者实践经验的考量。口译者根据外事场合的规格,身份,内容,气氛等因素,来确定口译节奏。根据口译的职业
降水作为全球地表物质交换、能量循环、生态系统和水文循环等过程的基础组成部分,是气候、水文及气象等研究领域的关键参数。传统的降水数据主要来自地面气象站点,但在高海拔地区站点布设不足,对于无资料或缺少资料的山区来说,揭示降水变化特征对促进区域经济发展,合理配置流域内的水资源显得尤为重要。另外,对西北干旱区来说,山区降水是地表水和地下水的重要补给源,降水特征的变化对径流变化以及区域水资流具有重要影响。河
<正>中国美院象山校区环山而建,带水缠绕,气象氤氲、景色秀丽,山上数栋小楼尺度宜人,参差于林间。附中综合楼便是其中之一,依山拾阶而上,建筑紧贴山体并融入其中。附中楼的设