基于语音的言语置信度评测算法研究

来源 :东南大学 | 被引量 : 1次 | 上传用户：wdwm

【摘要】

：

【作者】

：

谢跃

【机构】

：

东南大学

【出处】

：

东南大学

【发表日期】

：

2019年01期

【关键词】

：

谎言检测

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人在说谎时，由于环境压力所引起的心理变化会导致生理参数的变化，如皮电、脑电、血压、声带系统等，通常这些参数只受植物神经制约而很难受意识控制。基于这些生理参数对说话人言语真实度进行评测的方法称为言语置信度评测,通俗而言即谎言检测。早期的言语置信度评测指标主要以多道生理参数为主。然而，该方法需要佩戴各种专业设备来检测生理参数的变化，要求测试对象的高度配合，因此很难在实际应用中推广。因此，近来有学者基于语音等非接触式的指标进行言语置信度评测的研究，然而此类方法还有很多问题有待深入研究：（1）声学特征参数对言语置信度的影响；（2）基于声学特征的有效言语置信度评测模型及算法研究。
　　针对上述问题，本文从数据库建立、特征分析及模型建立方面进行研究，主要做了以下工作：
　　1、鉴于目前缺少心理压力相关的谎言数据库，本课题设计了相关实验场景并录制了两种心理压力下的言语置信度语音数据库。在较低心理压力下，被测人员面临的场景是实验性的，且实验过程中的谎言不会对说谎者本身产生较大影响；在较高的心理压力下，被测人员对实验并不知情，所陈述的谎言对被试的现实利益有直接的较大影响。基于上述两种数据库，本文分析了在不同心理压力下各种声学特征区分谎言与非谎言的能力，从而提出用可变维度的动态特征取代固定维度的静态特征的方法，以保留原始语音中的时序信息，便于挖掘谎言的动态特性。
　　2、在保证原始言语置信度模型的识别能力的前提下，为减少模型的计算复杂度，本文利用长短时记忆网络对动态时序语音特征的处理能力，提出两种注意力门并取代传统遗忘门的方法。与遗忘门相反，注意力门主要关注历史信息的有效部分，而不是遗忘无效部分。其中自注意力门只为历史细胞状态做加权运算，即关注历史信息在当前时刻的有效度。另一种加性注意力门则同时为历史细胞状态与候选细胞状态做加权运算，完成细胞状态的更新。在新的算法中，原始长短时记忆网络中的遗忘门与输入控制门均被删除，且权值矩阵的维度被减小，因而减少了计算复杂度。实验证明，与传统长短时记忆网络相比，该方法在减少计算复杂度的同时，提高了谎言识别的准确性。
　　3、为了区分长短时记忆网络的输出在时间维度和特征维度对谎言识别的差异度，本文分别在这两个维度上提出注意力加权方法，以区分谎言在不同时间片段中的信息量以及不同特征对谎言识别能力。在时间维度上，由于长短时记忆网络具有记忆信息的能力，因而其最后一次时间的输出含有较丰富的与任务相关的信息。为保证其能分配到较大的权重，本文以最后一次时间的输出作为参考信息量完成不同时间片段上的加权。在特征维度上，先计算在新的深层特征维度空间中的注意力分数，然后在时间维度上进行求和，获取特征在时间层面的统计特性。实验证明这两种方法均能有效强化特征中的关键信息，提高谎言识别性能。
　　4、为降低个体声带系统的差异对谎言识别的影响，本文提出了一种基于伪说话人信息的言语置信度识别模型。该方法首先对输入的谎言特征进行无监督聚类，获取伪说话人的标签信息，隐含对个体声带特性进行预分类。为了有效利用这些信息，本文则将这些标签信息作为输入开关信息，用来决定上层网络信息的流向，在上层网络中为每一类说话人单独建模训练，而底层网络则通过迁移学习固定参数，以减少时间代价。实验结果显示，该模型能基于不同说话人的差异来提升言语置信度评测准确度。
　　这些工作推动了基于语音的非接触式言语置信度的研究，为实现具有现实可用且对设备及个体依赖性较低的言语置信度检测工具打下了基础。

其他文献

论汉字图形在海报设计中的应用

针对近年来在海报设计中广泛应用的汉字图形创意表现技法进行实例的分析，并结合构成的多种组合形式进行比较研究。希望通过了解、比较、分析当前汉字图形海报设计的视觉表现形式，以及存在的潜在表现形态，能够为日后设计者提供具有实用价值的理论依据。　　

学位

海报

在综合类艺术院校实现基本乐科教学的合理性研究

本文从当前综合类艺术院校对视唱练耳和基本乐理课的课程设置入手，具体分析了视唱练耳与基本乐理单独授课所存在的问题，最终得到的结论是：视唱练耳与基本乐理是不可分割的，两者应合二为一，也就是实现基本乐科。其最终目标是使培养对象理论与实践相结合，更大程度的提高音乐基础能力，为其继续专业学习打下坚实的基础。　　

学位

艺术院校

存在与其逻辑之呈示——论音乐艺术意志的表现

艺术作品中以一种抽象的形式，即逻辑形式向人们呈示音乐艺术作品是情感的形式，或者说是能够将内在情感系统地呈现出来以供我们认识的形式。音乐的美既不单一存在于这个声音客体的种种属性之中，也不单一存在于接受者主体的主观意识之中，而是存在于二者之间微妙的“关系”之中，而这种关系就是逻辑呈示。创作者如何将其艺术意志在音乐作品中表现出来，这些组成音乐艺术作品的要素之间是以什么样的方式来呈示其中的关系，这是我们应

学位

音乐艺术表现

试论长笛演奏中的呼吸技巧

呼吸技巧是长笛演奏中的一个重要课题。而呼吸技巧的重要性常常被忽视和误识，通过研究分析各长笛流派，对呼吸技巧再认识，结合谱例重点论述呼吸技巧在演释作品中的合理运用。　　

学位

长笛演奏

浅谈获得良好的歌唱状态的有效方式——对声乐演唱中“紧张”与“放松”的辩证认识

任何运动都是“放松”与“紧张”协调作用的结果。歌唱过程中的运动也是如此，正确处理“紧张”与“放松”的关系是声乐学习关键之所在，也是声乐演唱成功与否的决定因素。　　本论文主要从歌唱中伴随着“紧张”与“放松”而出现的问题入手，并从歌唱的呼吸、歌唱的咬字吐字、声乐表演等四个方面从自身的视角对歌唱的“紧张”和“放松”进行了详细的论述，阐明“紧张”与“放松”在声乐实践中的重要地位，处理好二者的关系，才能使歌

学位

歌唱状态

海洋假交替单胞菌属细菌降解几丁质的特性及新型几丁质酶的表征

海洋是地球上最大的生态系统，海洋微生物在海洋生态系统和地球生物化学循环中起着极其重要的作用。几丁质是海洋中含量最丰富的有机碳，海洋微生物对几丁质的降解代谢，是海洋物质循环的重要推动力。海洋中能够降解几丁质的微生物有很多，但绝大多数海洋微生物降解几丁质的机制仍不清楚。假交替单胞菌属是海洋特有细菌，其广泛分布于全球海洋中，并具有相对较高的丰度。最近，基于生物信息学分析，有研究表明较高比例的假交替单胞菌

学位

海洋假交替单胞菌

哈氏噬纤维菌类组蛋白HU及IHF的功能研究

哈氏噬纤维菌（Cytophaga hutchinsonii）属于拟杆菌门（Bacteroidetes），是一种好氧的革兰氏阴性菌。该菌能够通过外膜上的纤维素吸附蛋白与纤维素结合，进而高效地降解纤维素结晶区。C.hutchinsonii不分泌游离的纤维素酶，也无纤维小体结构，研究证实这是一种全新且尚不清楚的纤维素降解策略，揭示C.hutchinsonii的纤维素降解策略对纤维素生物质资源的转化及利用

学位

哈氏噬纤维菌

PL36家族褐藻酸裂解酶和PL24家族石莼多糖裂解酶的酶学性质、结构和催化机制

全球海洋中有丰富的藻类。海藻多糖可以为海洋中的异养细菌提供碳源。海洋藻类多糖种类丰富，包括红藻中的琼胶、卡拉胶，褐藻中的褐藻胶及绿藻中的石莼多糖和阿拉伯半乳聚糖。褐藻酸是由β-D-甘露糖醛酸(M)和α-L-古罗糖醛酸(G)两种单体通过β-1，4糖苷键连接而成的褐藻多糖。根据褐藻酸分子中单体的排列顺序分为聚甘露糖醛酸片段(PM)、聚古罗糖醛酸片段(PG)和甘露糖醛酸-古罗糖醛酸杂合片段(PMG)。褐

学位

海藻

油菜素内酯和过氧化氢相互依赖促进保卫细胞淀粉降解和气孔开放

气孔是由两个高度特化的保卫细胞合围而成的孔隙。渗透压的改变引起保卫细胞收缩或膨胀进而导致气孔发生运动，这对于植物进行光合作用和蒸腾作用过程中的气体和水分交换至关重要。在经典的植物生理学中，关于调控气孔运动的机理存在两种假说:离子泵假说和淀粉-糖假说。随着分子生物学的不断深入研究，越来越多的实验数据支持离子泵假说，而对于淀粉-糖假说的实验证据却比较少。　　淀粉是植物体中碳水化合物的主要储存形式。为适

学位

植物生理学

煤热解和燃烧过程中NO的生成规律和控制的基础研究

氮氧化物是煤粉燃烧过程中释放的主要大气污染物之一.降低氮氧化物的排放需要从氮氧化物的生产和破坏机理出发,目前国内外对氮氧化物生成破坏机理并不是完全明确统一.针对这一情况,本文对煤热解和燃烧过程中氮氧化物的生成规律和控制进行了基础性研究.首先,在固定石英床中对十种不同煤种(包括4种无烟煤、3种烟煤和2种水煤浆及它们的制浆原煤)的煤进行热解实验,研究不同热解温度、不同停留时间、煤质、以及水蒸汽气氛对煤

学位

固定碳炉

基于语音的言语置信度评测算法研究

其他学术论文