论文部分内容阅读
计算机的普及和网络技术的发展,让人类能更便捷交流和通信。网络交互手段丰富多样,催生了许多类型的网络社区。网络社区指的是具有共同兴趣及需要的人们,利用网络通信的技术,通过网上互动而构筑的社会生活空间[Http1]。网络社区汇集了海量的用户及用户的讨论数据,尤其一些专门领域的网络社区,更是包含了这个领域内的专业知识,这为新的应用和研究提供了契机。
网络社区用户数量的持续增长和数据信息的日益丰富,带动了许多基于网络社区的应用的出现和发展,由问题路由技术支撑的问答服务就是其中之一。问题路由技术能在用户提交问题后,主动地将问题路由到合适的回答者,缩短问题被解答的时间。问题路由技术的核心,是将问题和用户进行问答匹配的问题路由模型。一方面,现有的问题路由模型,如语言模型和图分析方法等,都忽略了社区数据中包含的语义信息,没有充分利用社区数据的特性提高问题路由模型的效率;另一方面,问题路由模型在对问题的路由过程中,会带来提问者和回答者间的消息交换,在海量用户环境中,用户间的频繁交互,会给支撑问题路由技术的底层消息系统带来沉重的负载压力。由于用户间的消息交换是通过消息系统客户端实现的,消息系统客户端在消息系统各路由节点上的连接位置,会极大地影响消息交换的效率,进而影响到问题路由中用户间的交互效率。
基于此,本文旨在研究利用社交网络分析方法,对网络社区的问题路由模型及其消息系统进行优化:在应用层,问题路由模型中的用户通过讨论与交互,形成了用户问的社交网络及问题间的语义网络,本文对用户社交网络进行分析并与问题语义网络整合,来提高问题路由的准确率;在系统层,问题路由的消息系统客户端通过消息交换,也形成了客户端之间的通信关系网络,本文对客户端通信关系网络进行分析,通过优化客户端在消息系统节点上的连接位置,实现客户端的优化部署,缩短消息传递的路径长度,来提高问题路由过程中的消息传递的效率,提升消息系统性能;在客户端通信关系网络发生变化,客户端需要重新部署时,本文以部署代价为约束,通过客户端通信关系网络的迭代社区划分与聚集,达到系统性能提升与部署代价间的平衡,实现客户端的动态优化部署。
具体来讲,本文工作包括下面三个方面:
1)提出了整合语义网络与用户社交网络的问题路由模型
本文针对网络社区中数据的特性,提出了基于问题语义网络和用户社交网络整合的问题路由模型。本文先通过一个数据采集器搜集了三个网络社区的数据并分析数据的特性:然后基于分析结果,针对某些特定领域的网络社区,提出了问题的语义挖掘方法以及语义之间的语义网络构建方法;并将语义网络与用户的社交网络整合,用于问题路由。实验验证了模型的通用性,准确率和可扩展性,与现有方法相比,路由准确率能平均提高约20%[LiW10]。
2)提出了基于社交网络分析的消息系统客户端优化部署算法
本文在对问题路由模型的消息系统的客户端部署问题进行抽象的基础上,提出了基于社交网络分析的客户端优化部署算法。本文先构建消息系统客户端的通信关系网络,并对客户端通信关系网络进行分析,选取网络中权值较大的客户端点作为其他客户端的聚集中心;然后将其他客户端聚集在选取的聚集中心所在的节点或相邻节点,实现客户端的物理聚集。实验证明,相比于传统梯度负载均衡法,算法能将消息负载总量减小约20%[李09],并有效缩短了消息传递的路径长度,进而缩短了消息传递的时延。
3)提出了基于社区划分的客户端动态优化部署算法
本文考虑了当客户端关系发生变化时的客户端重部署代价,设计了客户端动态优化部署算法。本文将系统优化的性能指标定义为目标函数,将客户端的部署代价定义为条件限制约束;通过对客户端通信关系网络进行迭代的社区划分和社区聚集,实现部署代价与系统性能之间的折中平衡。实验结果显示,与现有的基于兴趣的聚集算法相比,算法在各种不同的实验设定下都能有效提高系统性能,系统消息负载平均减小约50%,消息传递时延平均减小约40%[李12]。