【摘 要】
:
针对传统话题检测方法在微博短文本上存在高维稀疏的缺陷,提出了一种基于特征融合的K-means微博话题发现模型。为了更好地表达微博话题的语义信息,使用在句子中共现的词对向
【机 构】
:
新疆大学信息科学与工程学院,中国电子科学研究院社会安全风险感知与防控大数据应用国家工程实验室
【基金项目】
:
国家自然科学基金项目(U1603115);自治区自然科学基金项目(2017D01C042)
论文部分内容阅读
针对传统话题检测方法在微博短文本上存在高维稀疏的缺陷,提出了一种基于特征融合的K-means微博话题发现模型。为了更好地表达微博话题的语义信息,使用在句子中共现的词对向量模型(Biterm_VSM)代替传统的向量空间模型(Vector Space Model,VSM),并结合主题模型(Latent Dirichlet Allocation,LDA)挖掘出微博短文本中的潜在语义,把两个模型得到的特征进行特征融合,并应用K-means聚类算法进行话题的发现。实验结果表明,与传统的话题检测方法相比,该模型的调整
其他文献
投资人经常要问的一句话是:你的盈利模式是什么?盈利模式对于企业是重要的。资本是逐利的,盈利模式对资本来说是不失惟一的,但是最重要的。
为对细鳞裂腹鱼幼鱼不同水体的人工饲养提供理论依据,利用金沙江水体(水温16.5℃,pH 8.20)设置NH 4 Cl浓度50.12 mg/L、56.23 mg/L、63.10 mg/L、70.79 mg/L、79.43 mg/L、89
简述了压水堆核电厂的发展历程,具体从压水堆核电厂所涉及到的各种设备、管道、风管、仪表等保温方面进行了论述,对其所需的保温材料及其技术特点进行了分析和研究,以期进一
随着时代的飞速发展,社会逐渐脱离了工业化的形态而向大数据时代发展,信息技术逐渐渗透到生活的方方面面。随着信息技术的成形,职业教育的改革也在信息技术的推动下不断深化,
为了探索大型科研仪器设备开放共享及其有序化管理在研究生培养过程中所起的作用,通过对哈尔滨工业大学市政环境工程学院实验中心科研仪器设备开放共享建设过程的实例分析,提
随着我国的经济持续不断的发展,城市中的各项设施在逐步完善,其中以前没有被重视的给排水工程也在逐步完善。随着人们的生活水平不断地提高,人们对生活中的给排水工程的重视
综述导电纤维的加工方法和各种导电纤维的性能特点,指出导电纤维加工技术的发展方面.
“十三五”的规划目标之一是确保贫困人口到2020年如期脱贫。目前按照我国贫困线(每人每天收入6.3元人民币)标准算,全国农村贫困人口约为7017万人。这些数据显示我国要如期达到
黑龙江省经济发展缓慢,产业结构一直以农业和重工业为主,在取消农业税以后,如何充分利用自身的优势促进黑龙江经济社会全面发展,是一个重要问题。制约黑龙江省经济发展的因素主要
以苯基三乙氧基硅烷(PTEOS)为功能单体,四乙氧基硅烷为硅源,甲基对硫磷为模板化合物,通过电化学法调节电极表面微区呈强碱性,促进硅氧烷水解,制备了甲基对硫磷分子印迹膜修饰玻