【摘 要】
:
近年来,大规模数据集的涌现增加了数据处理、传输和存储的软硬件负担。素描是一类基于随机化的算法,它使用结构化的随机素描矩阵将输入数据映射到低维素描子空间,同时保留数据的一些有用信息。使用素描技术,原始数据的一些统计量可直接在素描子空间内被近似地估计,因此能以一定精度损失为代价实现算法加速和数据降维。本文主要对素描算法展开研究,目的是提升它在张量计算应用中的近似精度和运算速度。鲁棒张量幂法(Robus
论文部分内容阅读
近年来,大规模数据集的涌现增加了数据处理、传输和存储的软硬件负担。素描是一类基于随机化的算法,它使用结构化的随机素描矩阵将输入数据映射到低维素描子空间,同时保留数据的一些有用信息。使用素描技术,原始数据的一些统计量可直接在素描子空间内被近似地估计,因此能以一定精度损失为代价实现算法加速和数据降维。本文主要对素描算法展开研究,目的是提升它在张量计算应用中的近似精度和运算速度。鲁棒张量幂法(Robust Tensor Power Method,RTPM)是一种张量CANDECOMP/PARAFAC分解算法,它在每一次幂迭代的过程中都需要计算张量收缩运算,导致计算效率低下。张量素描(Tenso Sketch,TS)技术已被用于加速RTPM,但现有基于TS的RTPM(TS-RTPM)是数据无意识(data-oblivious)的,没有利用输入数据的分布信息。本文提出首个数据驱动的TS框架TS-Fast-RTPM-Net(TS-FRTPM-Net),通过将TS-RTPM的算法的外层迭代展开为神经网络的快速幂迭代模块(Fast Power Iterations,FPI),从而提高了TS-RTPM的效率。具体地,TS-FRTPM-Net使用随机梯度下降法优化TS值矩阵和RTPM初始矩阵,以及使用两种贪心算法优化TS位置矩阵,提高了TS-RTPM的近似精度。此外,通过在FPI模块进行并行计算幂迭代,实现了对TS-RTPM的加速。实验结果表明,与TS-RTPM相比,TS-FRTPM-Net在准确性、速度和内存消耗方面具有优势,同时具备一定的模型可迁移性。现有一些素描技术存在一定的局限性:计数素描(Count Sketch,CS)本质上是针对向量的素描,当输入为高阶张量时,需对其向量化进行素描,因此构建CS矩阵需要一对大尺寸的哈希函数,增加了哈希函数的内存消耗。此外,针对一些具有特定结构的张量,如秩-1张量,CS无法利用其结构特征加速素描计算。TS使用多对小尺寸哈希函数构建素描矩阵,其存储消耗远低于CS,且对于秩-1张量具有快速算法。但TS矩阵的构建方式不可避免地造成哈希冲突,导致近似精度较低。本文结合CS与TS的优点,提出一种名为快速计数素描(Fast Count Sketch,FCS)的新的素描算法。FCS构建素描矩阵的方式与TS相似,但使用一种类似于公共溢出区的方法避免哈希冲突,在提升了TS的近似精度的同时,继承了TS低空间复杂度和高效计算秩-1张量素描的优势。理论分析和数值实验结果表明,与CS和TS相比,FCS在恢复精度或计算效率方面具有优越性。
其他文献
随着科技水平的不断发展,数据采集技术越来越成熟,应用领域中所获取的数据维度也越来越高。因此,人们提出利用具有高维结构的张量,将采集到的信息直接进行表示,从而能更好的表达数据信息。张量这种数据形式深受重视,经过多年发展,有了许多基于张量的数据处理技术,比如张量补全、张量分类等,而张量分解作为张量数据分析的一个重要方法,在各个技术中都有应用。本文主要讨论张量补全,即根据部分已知数据对完整数据进行恢复。
张量计算是数值代数和非线性优化领域研究和探讨的热点问题之一,它在图像恢复、图像与信号处理、计算机视觉、机器学习等领域有着广泛的应用.本文系统地研究了张量填充与张量最小二乘问题的理论、算法及其应用.第二章,研究一般低秩张量填充问题(?)rank(χ)s.t.PΩ(χ)=PΩ(M),利用Laplace函数和TV正则项,我们建立了新的张量填充模型,设计了交替方向乘子方法求解新模型,给出了算法的收敛性分析
成语是中华文化的结晶,一个成语就是一个中国故事,因此成语的翻译对中国文化“走出去”至关重要。文章以人民网2020年3月至2021年8月的相关报道为语料,在目的论指导下,通过案例分析的方法,总结出官方话语中成语翻译需要遵从的“五步”操作法,即“明确成语语源”“考察成语语义”“结合语境理解”“目的语验证”“通顺译语表达”,以及“套译”“直译”“释译”“音译+注释”等具体的翻译策略和方法。
当前,我国法治节目总体呈现出"老牌节目受众稳固""王牌节目全媒体化""栏目深度触网传播"等发展特征。本文聚焦全国最为知名的法治栏目《今日说法》,以其六年来广受关注的《大法官开庭》特别节目为研究样本,深度剖析新时代、新媒介格局下我国品牌法治栏目的创新制播趋势。
课程改革背景下,高中地理教学模式发生深刻变革,不再以知识讲授为单一目标,更重要的是提升学生思维灵活性与深刻性,发展学生解决问题的地理实践力。为适应高中地理教学改革的持续推进,文章简要论述指向问题解决的教学模式及其在高中地理教学中的应用价值,重点从发展学生地理学科思维、积极创设地理问题情境、实行生活化教学、开展合作探究活动、注重策略总结与提升五大维度阐释指向问题解决的高中地理教学模式构建与实施路径。
<正>主持人的话刘燕小朋友们,人生充满着矛盾,面对这些矛盾时,我们应该冷静思考,寻找解决矛盾的方法。你们是否有过“兴趣爱好”和“学习成绩”发生矛盾的时候呢?就是为了追求自己的兴趣爱好,而耽误了学习,导致成绩下降。在追求兴趣爱好的道路上遇到了阻碍,你该怎么办呢?小鹭姐姐在下面的文章中和小朋友们探讨一下这个问题,希望给正在面临这些问题的小朋友们一点启发。
<正>Data shows that Chinese brands are winning increasingly more consumers in recent years,especially among the younger generation.The trend is usually dubbed"guochao",or "Chinese fashion trend",which
<正>教学片段1:师:在这篇文章中,你最喜欢哪些描写?读起来的感觉是怎样的呢?(生读、思考后分享交流)生:“祖父栽花,我就栽花;祖父拔草,我就拔草……”这段话我很喜欢,因为我读这段话时仿佛也置身于萧红祖父的园子中,和萧红一样感受到了快乐。(生继续分享读文的快乐,略)
文章以“正、反比例的意义”教学为例,提出对比教学法的运用路径,以使学生从多个角度理解正比例和反比例两个概念的异同点,更好地抓住概念的本质属性。
<正>纺织在我国有着几千年的历史。它是传统工业,更是国民经济不可或缺的重要组成部分。从改革开放、加入WTO,特别是党的十八大以来,中国从纺织业大国逐步成长为全球纺织业的强国。从一根纤维到最后的成衣,中国已经形成了全球最完备的纺织产业链,这背后,藏着怎样的行业发展“领跑的密码”?