论文部分内容阅读
基于位置的社交网络(Location-Based Social Networks,简称LBSNs)是一种新型的社交网络,签到(Check-in)是LBSNs的重要组成部分。探索用户签到背后的行为规律,可以帮助商家进行更好地精准营销,同时消费者可以从中得到更加优质的服务,另外,了解其中的规律对LBs类应用的设计和开发也具有一定的指导意义。在此背景下,作者对LBSNs中的用户签到行为进行研究。研究目的主要有两个:第一,探索合适的工具和方法收集LBSNs中签到数据;第二,探索对收集到的数据处理及分析方法,以便探索数据背后的应用价值。作者选取嘀咕网作为研究平台,整个研究过程分两个阶段:第一阶段,通过文献调研,作者发现第三方工具GooSeeker比普通网络爬虫能更准确地寻找所需目标数据,并能够按照用户指定的数据采集原则采集互联网数据,因此利用该工具收集嘀咕网数据,共得到2.6万多名用户的100多万条签到数据,以此作为原始数据源存放到MYSQL数据库中。在第二阶段,作者分别从签到时间、签到地点及签到地评论三个方面进行研究,探索了相应的数据处理及分析方法。在第二阶段,作者重点研究签到地评论,选取其中包含“麦当劳”的信息作为研究实例,使用分类工具SVMCLS将用户评论划分为不同的倾向级别,从而得到用户对麦当劳的主观倾向性,并进一步分析了该主观倾向性的时间分布情况和影响因素。主要发现了以下几个规律:在签到时间分析中,作者发现用户签到存在周期性规律,即一天中上午签到明显低于下午,并在午饭时间达到高峰,一周当中周五明显比其它工作日签到频率要高;在签到地点分析中,发现一线城市明显比其它城市签到热点地区多,地点类型上以消费类为主;在签到地评论分析中,作者发现用户趋向于给予好评,并在时间分布上没有明显波动。在论文中,作者探索了获取LBSNs应用中数据的工具和方法,并采用适当的方法对数据做了整理和分析,并对结果的应用价值做了总结,其中所用的方法和工具为以后的类似研究提供了一定的参考。