基于网络结构和文本内容的群体画像构建方法研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:cm603
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]在基于社会网络的用户画像研究中,针对传统用户建模难以处理复杂网络关系,群体构建多基于内容,以及群体相似度低或紧密性差的问题,提出基于网络结构和文本内容的群体画像构建方法.[方法/过程]首先,采用卷积神经网络方法,融合网络结构和文本内容两方面特征将网络用户表示成空间向量,其次,在k-means算法基础上结合模块度计算方法,对空间向量进行聚类,然后,在爬取的中英文数据集上分别进行对比研究,最后,从中文数据集中选取1000名重要性用户进行实例分析.[结果/结论]实验结果表明,该方法的密度值比基于内容的方法平均增加0.105,熵值比基于结构(含基于结构和内容)的方法平均减少0.955,实例分析进一步说明文中方法的可行性.
其他文献
介绍基于ELK搭建的CDN日志分析系统的架构,以及日志采集、日志解析、日志存储、分析呈现等模块现网部署配置方法,实现CDN多厂家日志的汇聚展现,并可按照服务分组、业务域名以
互联网舆情监测成为政府及大型企业的一项重要工作,本文提出了一个舆情大数据系统的建设框架,该框架从采集、存储、大数据分析及应用等几个方面研究了如何利用中国电信天翼云
《静俭堂集》二十卷,十四册二函。明熊化著,熊兆登、熊兆行编。明崇祯十四年(一六四一)刻本。每半叶八行十九字,白口,四周单边,单鱼尾。上书口题“静俭堂集”,中署卷第,序之下书口镌“
伴随着新世纪钟声的敲响,人类迈入了又一个千年2002年.在这辞旧迎新进入21世纪的特殊日子里,我们编辑部全体同仁谨向多年来一贯支持和关爱我们刊物的广大作者和读者表示由衷
计算机技术和互联网技术的发展使得人类信息以前所未有的速度递增着,网络信息资源成为展现和记录社会活动的重要信息源。与此同时,由于网络社会的固有弊病,使得网络信息资源存在
[目的 /意义]移动社交时代的数字阅读的最大特点是其互动性,然而现有理论研究对于移动社交阅读的互动机制和互动效应涉及的较少,有必要对移动社交时代数字阅读的互动机制和互
本文主要论述中国联通某地运营商的基础网络现状、面临的问题和挑战,通过对用户NPS(Net Promoter Score,用户的净推荐值)的痛点分析,着眼于用户的流量模型、使用习惯,得到解
2011年初,美国政府发布了《美国创新战略:确保美国经济增长与繁荣》报告。该报告不仅对奥巴马上任以来美国政府采取的所有创新举措进行了系统归纳,同时也对美国未来科技发展做
Web2.0网络环境既给图书馆组织文化带来了新的理念,又对传统的图书馆组织文化提出了挑战。Web2.0环境下基于组织文化的图书馆人力资源管理,是将Web2.0的理念及技术应用于图书馆
数字环境下,清晰的著作权流转与归属是保证各主体相应利益的必要前提,其中著作权转让及许可是体现著作权流转与归属的重要环节之一,相应协议的规范与完善直接影响到科技期刊