【摘 要】
:
近年来,随着科技的飞速发展,科研成果的数量以一种爆炸式增长趋势持续上升,每天会有近万篇新的学术文献被公开发表。伴随着移动互联网的兴起,各大学术机构和相关数据服务公司都对外开放了大量的学术数据,相关的科技资讯也趋于井喷式的爆发,增加了在科技内容之间的曝光度。以上资源一般包含有多模态类型数据,例如有文本和图像类型。不同模态间的资源信息数据结构具有巨大的差异,一般是以非结构化的形式进行展示。这会导致即使
论文部分内容阅读
近年来,随着科技的飞速发展,科研成果的数量以一种爆炸式增长趋势持续上升,每天会有近万篇新的学术文献被公开发表。伴随着移动互联网的兴起,各大学术机构和相关数据服务公司都对外开放了大量的学术数据,相关的科技资讯也趋于井喷式的爆发,增加了在科技内容之间的曝光度。以上资源一般包含有多模态类型数据,例如有文本和图像类型。不同模态间的资源信息数据结构具有巨大的差异,一般是以非结构化的形式进行展示。这会导致即使投入精力,也只是获取到大量的无效信息。如何从这些海量的科技资源中挖掘分析其核心有效信息具有非常重要的意义。本文完成的主要工作如下:(1)提出了科技资源信息的数据采集方案与基于深度学习的跨媒体语义特征提取算法以实现对跨媒体科技资源信息的语义特征提取。采用分布式爬虫技术与海量信息存储技术进行对科技资源信息的数据采集,并利用深度网络模型实现对科技资源文本与图像的语义特征向量提取。(2)提出了科技资源实体信息与实体关联关系挖掘与发现方法,提出了基于BERT融合局部特征的注意力机制的科技实体抽取算法(BBLAC),实现了对科技资源信息中无效信息的过滤,对核心有效信息进行抽取。实验结果表明,在抽取实体信息实验中本文算法结果指标均优于对比算法。提出了基于多重维度的科技资源实体关键词相似关系判定算法(MDESJ),实现了对科技实体间相似关联关系的扩充,完成对科技资源的立体画像。(3)提出了科技资源实体的跨媒体语义关联关系分析与抽取方法,提出了基于生成对抗网络与共享语义结构的科技资源跨媒体语义关联算法(SSGACA),使用跨媒体检索技术实现文本对图像的检索,以更为直观高效的图像方式展示出多模态信息,实现对科技资源立体画像的多媒体资源内容的补充。(4)设计并实现了基于深度学习的跨媒体科技资源立体精准画像系统。系统主要包含以下几个模块:基于深度学习的科技资源实体的跨媒体语义特征提取与表达模块、科技资源实体信息与实体关联关系挖掘与发现模块、科技资源实体的跨媒体语义关联关系分析与抽取。主要实现了以下几个功能:数据采集、科技资源立体画像、跨媒体科技资源检索与展示。并对系统进行了测试与验证。
其他文献
根据国务院颁发的《“宽带中国”战略及实施方案》,到2020年,基本建成覆盖城乡、服务便捷、高速畅通、技术先进的宽带网络基础设施.固定宽带用户达到4亿户,家庭普及率达到70%,光纤网络覆盖城市家庭.到2020年城市和农村家庭宽带接入能力分别达到50Mbps和12Mbps,发达城市部分家庭用户可达1吉比特每秒(Gbps).近年来在线点播、在线教育、IPTV以及互动游戏等业务,特别是4K视频、虚拟现实等业务的蓬勃发展,原有的100M/200M接入带宽已满足不了用户的业务需求,宽带产业正步入千兆时代.原有的GPO
电表的台区识别一直是泛在电力物联网中的一个难题,建立了一套类似于衰落信道的新分析模型,并基于有载调容调压配电变压器的远程有载调压功能,将信道编码理论应用于该难题的解决,为识别区域中不同台区的智能电表并同步施加不同的具有重复编码和分组编码性质的特殊调压图案,同时利用用电信息采集系统收集各智能电表在该时间段中的电压数据,最后基于译码算法的最小距离原则实现对每只电表的台区识别.理论分析和测试结果表明,和传统技术相比,新技术无须升级即可在现有电网系统中,实现对有载调容调压配电变压器台区中大量电表的高准确性台区识别
介绍了认知雷达通信(CRC)收发器的系统架构,提出了一种认知雷达通信复合波形的设计方法.此方法旨在从雷达场景中估计目标散射系数(TSC),同时实现高速率数据通信.为了降低TSC的均方误差(MSE),建立了在实际雷达系统多约束条件下的认知复合波形优化模型.通过基于卡尔曼滤波的方法设计超宽带(UWB)传输脉冲集,并利用多元位置相移键控调制技术(MPPSK)将信息数据嵌入其中,从而实现峰均功率比(PAPR)约束的最佳解决方案.实验结果证明,随着迭代次数的增加,TSC估计和目标检测概率均有所提高.同时,在CRC收
转眼间,2022已向我们走来.rn回首2021,暗潮奔涌,亦有星光.rn丝网印刷作为服务于我国工业及包装印刷等产品生产、加工与装饰的重要组成部分,呈现出高质量快速发展的良好局面.然而,在经济发展转型升级的当下,丝网印刷行业面临着产能过剩、VOCs治理、产业链转移、工业喷印技术快速发展等问题,多重压力在身,必须尽快寻求突破.在这样的情况下,“自动化、智能化、数字化、绿色化”无疑是解决困境的主要着力点.
随着图像识别技术的快速发展,人脸血缘关系认证由于其重要的应用价值逐渐受到越来越多研究者的关注。作为一项新兴的生物特征识别技术,它具有许多潜在的应用价值,包括失踪儿童搜索、家庭相册管理和社交媒体分析等。不同于传统人脸识别问题,人脸血缘关系认证面临着更大的挑战,主要表现为相似性特征提取难度大、现有数据集规模较小。本论文从特征与数据这两个角度出发,提出了提升人脸血缘关系认证性能的多个方法,并设计可视化界
在科学技术快速发展的情况下,广播电视行业迎来了发展的全新时代,为了逐渐提升广播电视信号传输效果和传输的安全性,工作人员需要全面掌握信号传输原理,深入研判传输中可能产生的影响因素,这样才能解决信号传输中存在的现实问题.广播电视在为群众提供信息服务的同时,也丰富了群众的业余生活,需要通过高质量的节目引导观众的正确价值观,发挥出良好的教育功能,电视信号传输和用户体验有着直接联系,因此需要重视安全播出问题.本文在研究过程中,将山西广播电视无线管理中心所属台站作为研究案例,主要针对广播信号传输与安全播出问题进行深入
在人们生活水平不断提升的背景下,用电需求量逐渐增加,如何保证电力供应的安全稳定性,已经成为电力企业急需解决的问题之一.为了满足电力系统的运行需求,保护电力系统的调度自动化具有至关重要的作用.相比于传统通信技术,光纤技术具有的传输效率比较高,更能满足电力系统的调度要求.本文首先分析光纤通信技术的特征,其次探讨其在电力系统中的应用,以期对相关研究具有一定的参考价值.
在我国经济快速发展的背景下,民众的物质生活水平得到了快速提升,这就为我国有线电视技术的发展提供了巨大的空间,有线电视技术具有先进性、便利性特点,如今,有线电视技术已经得到了广泛使用,且发展速度非常快.宽带技术和有线电视技术之间既有相同点,也有不同点.只有实现有线电视技术和宽带技术之间的融合发展,才能保障信号传播技术的持续、高效发展.
在广播电视事业的发展过程中,地面数字电视发射系统以其便携性、高质量、覆盖广、自动化与智能化程度高的特点,有力的推动了广播电视事业的发展.本文对地面数字电视发射系统的特点及其信号传输覆盖过程中存在的接受不良的问题进行了研究,旨在进一步推动地面数字电视发射系统在广播电视事业中的应用,解决地面数字电视信号存在的覆盖与接受不良的问题.
在整个广播节目播出过程中,音频信号的发送和接收对传输质量要求较高,由于客观因素影响导致广播电视节目传送信号期间出现中断可能,由此对节目的正常播放产生影响.为了确保音频信号传输质量,需要完善传输标准,最大程度降低信号干扰带来的不利影响.本文从现场直播音频信号传输方式入手,讨论广播节目传送中传输音频信号的问题与解决方法,希望对相关研究带来帮助.