多模态特征相关论文
为解决传统音乐情感分类特征单一,导致训练效果差的问题,提出了一种多模态注意力融合网络模型,首先将执行情感分类使用的歌词和音频分......
人脸反欺骗技术可以准确判断捕获的人脸图像是真实人脸还是虚假人脸,是人脸识别系统安全的重要保障。传统的人脸反欺骗方法主要是利......
央视春晚是中央广播电视总台最具品牌力的综艺节目,是增加节日气氛、愉悦人民生活、传播国家形象的重要媒介。其中的语言类节目以......
根据传播学的“声画关系”理论,新闻类短视频通过音频直接有效地传达视频内容,属于典型的“主声说”视频。现有视频摘要技术忽略了声......
【目的】在线评论有用性有助于消费者快速获取有效的信息,本研究利用深度学习模型对旅游评论的有用性进行识别,以更好地让消费者和酒......
随着多媒体技术和网络通信技术的不断发展,如何高效的进行短视频智能分析与管理成为亟需解决的问题。视频描述作为智能视频分析领......
智能驾驶关键技术主要包括感知、认知和控制三个部分。环境感知作为其第一个环节,是认知和控制的基础。它使用车载传感器对本车及......
针对视频动作预测领域的算法在不同预测时间预测效果不稳定的缺陷,提出一种基于自注意力机制的多模态LSTM的动作预测模型。综合考......
在复杂的室内环境中,存在光线照射不均匀、物体繁多且大小不同,物体间颜色和纹理相似度高以及相互遮挡等情况,使基于彩色图像的分......
行为识别是视频分析领域的重要研究课题,在视频监控、医疗辅助、人机交互等场景中应用广泛,其目的是借助计算机视觉技术自动分析和......
随着深度学习日益发展,人工智能领域迎来发展热潮。无论在计算机视觉,还是自然语言处理、语音处理等领域,深度学习都取得了突破性......
近年来,人工智能研究和应用的热度持续上升,AI在许多领域中都展现出其独特的优势。智慧农业是人工智能与农业领域应用场景相结合的......
随着工业现代化时代的到来,近年来生产过程的安全性和产品质量的可靠性已经得到人们更多的重视。基于数据驱动的过程监测策略已成......
人体行为识别在计算机视觉和模式识别领域仍然是一个很有挑战性的难题。但是,具有深度感知功能的类似Kinect等产品,能为存在互相遮......
视频的镜头类型是视频底层特征和高级语义之间的桥梁,能有效弥补两者之间的鸿沟,有助于视频精彩事件检测,促进创建视频摘要,进而满足用......
多模态特征,是指通过不同特征表达方式描述对象的属性。采用多模态特征有助于提高对象固有属性的表达能力,因此在现代图像识别与检......
随着人工智能领域的高速发展,图像处理技术也愈渐成熟,其中目标跟踪在智能交通、公共场所安防、医学图像处理等方面均有广泛应用。......
在当今的信息社会时代,视频数据呈现爆炸增长的趋势。从海量视频中获取有价值的关键信息变得尤为重要。随着深度学习技术的快速发......
随着大数据与人工智能技术的发展,将人工智能技术应用到法律领域已受到越来越多的关注,利用已有的裁判文书信息进行类案推送,已经......
随着新型社交网络的兴起,社会网络服务得到了飞速的发展,这促使人们可以更加快捷方便地进行信息传播与实时交流。但是社交网络在促......
随着多媒体产业的迅速发展,在生活中音频分析、图像分析和视频处理等方面的研究得到了越来越多人的关注,如何更好地去描述一个音频......
随着计算机网络和多媒体技术的飞速发展,数字视频在人们的生活中成为不可或缺的信息载体。如何帮助人们从海量视频数据中找到自己......
网络语言随着计算机技术的兴起逐步进入人们的视野,并随之出现了网络语言学,对网络语言进行了不同方向上的研究.网络语言具有明显......
随着高校扩招和高等教育国际化趋势的增强,国内外高等学校间的竞争日益激烈,从而迫使各高校通过各种措施、手段谋求学校的发展。在此......
侦讯问答属于典型的机构性话语,具有明确的任务导向性,其任务的完成主要依靠讯问中的问和答来实现。然而侦查员与嫌疑人的问答互动......
本文以英文心理学教科书为语料,在系统功能语言学的理论框架下探讨多模态和语类之间的相互建构关系,并由此展现心理学教材的语篇特征......

