【摘 要】
:
语音增强能有效解决人机交互和语音识别等技术中的噪声干扰问题。为了提高语音增强的效果,提出了一种结合高效通道注意力机制的生成对抗网络,并在两种不同的数据集下进行实验。该方法通过在生成对抗网络的生成器中加入高效的通道注意力机制来提高抑制无关于语音增强的信息来提高模型的灵活度与准确率。该模型在Nonspeech-100数据集相较于基线模型下语音感知质量评估(PESQ)平均提升了2.79%,语音短时客观可
【基金项目】
:
国家自然科学基金项目(62161040); 内蒙古自然科学基金项目(2021MS06030); 内蒙古科技计划项目(2021GG0023);
论文部分内容阅读
语音增强能有效解决人机交互和语音识别等技术中的噪声干扰问题。为了提高语音增强的效果,提出了一种结合高效通道注意力机制的生成对抗网络,并在两种不同的数据集下进行实验。该方法通过在生成对抗网络的生成器中加入高效的通道注意力机制来提高抑制无关于语音增强的信息来提高模型的灵活度与准确率。该模型在Nonspeech-100数据集相较于基线模型下语音感知质量评估(PESQ)平均提升了2.79%,语音短时客观可懂度(STOI)平均提升了0.95%;在NoiseX-92数据集下,ESQ平均提升了3.8%,STOI平均提升了2.03%。实验结果表明,该方法在没有增加很大的计算量的情况下提高了模型的性能。
其他文献
目的探讨腹主动脉阻断术在肾蒂损伤中的应用价值及肾蒂损伤的诊断及治疗方法,以期提高肾蒂损伤的诊治水平。方法分析1例肾蒂损伤后联合腹主动脉钳夹阻断术修补肾静脉的病例,并进行肾蒂损伤诊治及腹主动脉阻断术相关文献回顾。综合讨论肾蒂损伤的诊疗方法及腹主动脉阻断术的手术方法和临床应用现状。对腹主动脉阻断术在肾蒂损伤中的实施可行性进行分析。结果本例肾蒂损伤病例救治过程中,术中探查见术野出血严重,患者病情危急,行腹主动脉阻断术,探查肾静脉破口并顺利修补,术后成功保留了肾脏,术后随访3个月,患者恢复良好。结论腹主动脉阻断术
目的探讨宫内节育器(IUD)迁移导致的多种系统损伤病例的诊治情况并文献复习,以期为临床医生提供更合适的治疗选择。方法结合本院2011年1月至2021年2月收治的5例病例,检索PubMed、Embase等数据库最近10年的相关文献,以确定类似的研究并进行文献复习分析。结果本院收治结合数据库检索出的病例以节育器异位至各个系统进行划分,共检测到异位至泌尿系统患者53例,异位至消化系统患者共41例,异位至生殖系统患者共19例,异位至大网膜7例、腹膜后8例及盆腔1例。临床表现包括下腹痛、血尿及排尿困难、阴道流血及尿
目的报道2例以盆腔腹膜外巨大占位为首发表现的前列腺癌病例并结合文献进行复习分析。方法收集2020年10月及2021年4月本院收治的以盆腔占位为首发表现的2例前列腺癌患者的临床资料,查阅国内外文献,进行回顾性分析。结果本文报道的2例患者以盆腔腹膜外巨大占位为首发表现,在行盆腔肿瘤切除术后病理报告提示前列腺癌,随后行前列腺癌根治术,术后给予内分泌治疗,分别进行了6个月及1个月的随访,随访情况良好。结论对于男性盆腔肿瘤患者,应在术前化验前列腺特异性抗原(PSA)及盆腔MR或前列腺多参数MR,如符合前列腺穿刺指征
目的探讨多囊肾合并尿酸结石的临床诊断依据及药物溶石治疗效果。方法回顾性分析2016年1月至2019年12月本院临床诊断并采用药物成功溶石治疗的3例多囊肾合并尿酸结石患者的临床资料。3例患者的血尿酸均>460μmol/L,结石CT值均为500~700Hu,腹部平片(腹部X片)极淡显影。其中2例因治疗前处于肾功能不全失代偿期,行输尿管支架置入术。3例患者均经过B超、CT检查确诊为多囊肾,且根据单中心经验临床诊断为尿酸结石。3例患者均采用口服枸橼酸氢钾钠、别嘌呤醇及碳酸氢钠的联合药物治疗方法,并根据尿液pH值情
慢性荨麻疹是一种主要由肥大细胞驱动的疾病,目前发病机制尚不完全清楚。近年来一种具有组胺释放活性的组胺释放因子(histamine-releasing factor, HRF)被证明与过敏性炎症有关,但其在慢性荨麻疹中的作用机制尚未完全阐明。本文就二聚体HRF通过诱导肥大细胞脱颗粒,从而诱发慢性荨麻疹及其他过敏反应的作用机制进行阐述,并为慢性荨麻疹的治疗提供了一个有希望的靶点。
高管与员工薪酬差距问题是国内外公司治理研究领域的经典主题。高管是公司各种经营管理战略的制定者与决策者,员工是高管决策的实施者,相比员工,高管承担更大的责任,理应获得更高的薪酬,但公司经营目标的实现需要高管与员工的积极配合与合作。高管与员工工作积极性会受到薪酬差距程度设置问题的影响,公司绩效也会因工作积极性程度受到影响。对于薪酬结构管理来说,薪酬差距的设计是其不可缺少的成分。而对于薪酬制度来说,薪酬
传统用户登入语音识别模型的泛化性能较差,导致语音识别精度不理想。为解决上述问题,构建基于多任务训练的用户登入语音识别模型。利用循环神经网络(Recurrent Neural Network, RNN)的数据处理能力,将多任务学习(Multi-task learning, MTL)应用在循环神经网络中,采用共享隐层学习的方式并行训练多个任务,获取更多共享特征,完成多任务学习,提高循环神经网络泛化性能
偶像崇拜由来已久,其作为人类社会性的特殊表达形式,在时代发展的不同阶段呈现代际化的衍生偏向,偶像在生成样态以及象征意义等方面伴随着各类因子的流变进行更迭,足以窥见不同时空维度内的文化发展差异,偶像文化成为当代文化传播研究领域的重要分支。本文以网络新媒介语境下的偶像传播策略为研究焦点,选取李雪琴进行个案分析,首先将偶像在传统媒介时期和信息媒介时期的演变路径进行纵向梳理,而后基于准社会交往研究视角,利
当今社会由于生活质量提高,人们对健康越来越重视,表现出对运动锻炼的极度需求,各类时尚健身运动蓬勃发展,新鲜且刺激的户外运动成为人们进行体育锻炼的首选。随着户外运动方式的流行,大批的运动爱好者追随进入到户外的自然环境当中,无论是个人、家庭或是团队公司旅行,随意丢弃的垃圾却在无形之中给自然环境带来了破坏和污染。此时,“顺手捡跑团”逆风而行。当他人还在破坏环境时,捡跑者们却用自己的方式维护着环境的整洁,
近几年随着网络的发展,基于位置的信息服务在商城、港口、仓库等场景的运用越来越多。射频识别技术以射频信号通过交变磁场实现信息交换,通过所获取的信息完成目标自动识别。其在室内定位中显示出良好的性能,具有多目标识别、目标间无接触、目标识别快等优点,因此对基于RFID定位技术进行研究,对于我国室内定位的完善、发展有着重要意义。本文首先描述了射频识别系统原理,对基于信号强度值定位技术中的LANDMARC定位