【摘 要】
:
随着互联网与各行各业的进一步融合,互联网渗透到人们日常生活的速度逐步加快。这些应用和服务的发展,在加快互联网普惠化进程的同时,也带来了“信息迷航”、“信息过载”等十分棘手的问题,使得用户在面对海量信息时无法高效便捷地找到真正满足自己需求的内容。值得庆幸的是,用户在参与互联网信息创造、传播和消费的过程中,积累了大量的个人行为数据,为平台对用户行为的建模,以及提供个性化、智能化和定制化的服务带来了契机
论文部分内容阅读
随着互联网与各行各业的进一步融合,互联网渗透到人们日常生活的速度逐步加快。这些应用和服务的发展,在加快互联网普惠化进程的同时,也带来了“信息迷航”、“信息过载”等十分棘手的问题,使得用户在面对海量信息时无法高效便捷地找到真正满足自己需求的内容。值得庆幸的是,用户在参与互联网信息创造、传播和消费的过程中,积累了大量的个人行为数据,为平台对用户行为的建模,以及提供个性化、智能化和定制化的服务带来了契机。向量化用户的兴趣偏好是目前应用最为广泛的在线行为建模方案。但是,用户历史行为数据的爆炸式增长,导致现有的建模方案在应对数据的海量性、稀疏性、异构性和低质性等方面还有很大的提升空间。为此,本文主要从二分网络表示学习和跨领域迁移学习两个角度展开研究,提出了三种用户在线行为向量化算法。主要贡献如下:·基于二分网络表示学习的用户行为向量化由于用户、项目的交互行为天然地构成了一张二分网络,所以设计并实现了一种可用于用户行为向量化的二分网络表示学习算法——Bi NE,旨在利用网络拓扑结构挖掘出顶点间的显式和隐式关系来缓解数据稀疏问题。Bi NE算法设计了变长的自适应的随机路径生成器,不但能够捕获二分网络的高阶隐式关系,而且很好地保留住了二分网络中节点度的长尾分布特征;进一步基于结构感知的负采样方法优化了算法效率。·基于联合矩阵分解的用户行为向量化为了解决Bi NE方法捕获顶点间隐式关系时需要生成海量随机路径的局限,通过理论分析,近似地给出了Bi NE算法对应的矩阵形式。从而能够在不生成随机路径的情况下就能获得充分的顶点间隐式关系。并通过设计与实现一种联合矩阵分解算法,将其应用于用户行为的向量化。·基于迁移学习的用户行为向量化利用成熟领域的信息向目标领域进行迁移,设计并实现了一种基于跨领域迁移学习的用户行为向量化模型——TLUM。该模型以领域间共同的用户、项目为桥梁,利用用户、项目相似度和基于最近邻的迁移方法将成熟领域的用户行为特征迁移进目标领域,有效的缓解了由数据稀疏和低质带来的问题。此外,还建立TLUM与二分网络顶点向量化的关系。
其他文献
科技日报讯(记者陈丹)据英国《卫报》和《自然》杂志网站7月4日(北京时间)报道,日本横滨市立大学与美国西奈山医学院科学家合作,利用人类诱导多能干细胞(iPS细胞)构建出微小“肝芽”,
近年来,受限空间伤害事故频发,已引起各相关部门的重视。个体防护装备的合理正确选用在避免受限空间伤害事故的发生上起着至关重要的作用。本文通过典型案例,仅从个体防护装
<正> 电子商务(Electronic Commerce)泛指运用于商品流通过程中的网络交易方式。电子商务的快速发展使未来的企业营销通过一种虚拟的市场参与无国界的网上竞争。进入90年代,
通过对某商场进行安全生产标准化评审,评审结果显示:该商场在基础管理建设方面存在五项安全问题,即安全管理组织、安全生产责任制、安全生产教育培训、应急管理和安全生产资金保
目的探讨雌激素对小肠葡萄糖吸收的调节作用。方法随机选取性成熟期C57雌鼠(6周龄),分为假手术组和去卵巢组,采用Ussingchamber实验观察假手术组与去卵巢组在十二指肠粘膜葡
针对传统的基于SINC插值的自适应时间延迟估计方法估计误差较大、收敛速度较慢等问题,提出了一种新的插值方法和相应的自适应时延估计方法.根据LMS自适应时延估计方法中最优
经皮冠状动脉介入治疗(PCI)已经成为冠心病的主要治疗方法,无论国外还是国内,PCI例数逐年增加。与PCI相关的新器械、新技术、新策略和新药物不断问世,操作技术也不断提高,从而明显
第二次国内革命战争时期,湘鄂赣苏区各级党组织在率领当地人民与敌人进行激烈的武装斗争的同时.认真贯彻党的六大关于开展土地革命的精神,从本地区的实际情况出发,开展了轰轰烈烈
我国是一个多民族国家,由于语言、习俗、信仰、地域等差异,造就了形态多样、各具特色的民族文化。语言文字的多样性,决定了民族教育语文课程与教学的多元性。少数民族地区的
本文以满足灾难医学需求为最终目的,基于将“管理”定义为“资源满足需求的组织行为”的思路,对“灾难医学管理学”内涵、理论框架、研究方法及其与其他学科之间的关系提出