-
公开(公告)号:CN112738033A
公开(公告)日:2021-04-30
申请号:CN202011492623.7
申请日:2020-12-17
申请人: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
摘要: 本发明属于计算机及语音文件存储技术领域,特别涉及一种WAV语音文件的加密及解密方法,包括以下步骤:获取原始WAV语音文件;通过编码器处理原始WAV语音文件;通过解码器处理新WAV语音文件。本发明对WAV语音文件的采样数据信息基于G.711编码规则进行重新编码,生成新的文件头信息,得到加密并压缩的WAV语音文件,并且可以通过相应的解码器恢复原始的WAV语音文件,解决了语音数据在存储和传输过程中的数据安全性问题。
-
公开(公告)号:CN115063297A
公开(公告)日:2022-09-16
申请号:CN202210760864.8
申请日:2022-06-30
申请人: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
摘要: 本发明属于超分辨率图像重建技术领域,特别涉及一种基于参数重构的图像超分辨率重建方法及系统,通过构建用于对输入图像数据中的低分辨率图像进行特征提取并依据提取特征进行图像重建的超分辨率重建网络,其中,超分辨率重建网络中,首先利用标准卷积来提取输入图像数据的浅层特征,然后利用参数重构的深度可分离卷积提取浅层特征中的深层特征,利用深层特征进行图像重建;利用收集的样本数据进行网络训练;并针对待重建的图像数据,利用训练后的超分辨率重建网络进行特征提取和图像重建。本发明通过参数重构进行特征提取,能够在减少网络参数量和计算量的同时,实现更深层次的特征提取,提升重建图像质量,便于实际场景应用。
-
公开(公告)号:CN114120367B
公开(公告)日:2023-06-13
申请号:CN202111432749.X
申请日:2021-11-29
申请人: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
IPC分类号: G06V40/10 , G06V40/20 , G06V10/74 , G06V10/774 , G06V10/764 , G06V10/82 , G06N3/08
摘要: 本发明属于图像识别处理技术领域,公开一种元学习框架下基于圆损失度量的行人重识别方法及系统,使用基于度量的元学习方式对行人重识别问题进行建模,同时引入改进的圆损失进行度量学习,实现了样本相似性自适应加权优化的目的。本发明在基于度量的元学习框架下,对行人重识别任务进行建模;通过引入圆损失并对其进行改进,以适应元度量学习的学习方式,对查询集和支持集之间的相似性分数进行自适应加权,改善样本的相似性优化性能,从而提升模型的训练效果。
-
公开(公告)号:CN114120367A
公开(公告)日:2022-03-01
申请号:CN202111432749.X
申请日:2021-11-29
申请人: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
IPC分类号: G06V40/10 , G06V40/20 , G06K9/62 , G06V10/74 , G06V10/774 , G06V10/764
摘要: 本发明属于图像识别处理技术领域,公开一种元学习框架下基于圆损失度量的行人重识别方法及系统,使用基于度量的元学习方式对行人重识别问题进行建模,同时引入改进的圆损失进行度量学习,实现了样本相似性自适应加权优化的目的。本发明在基于度量的元学习框架下,对行人重识别任务进行建模;通过引入圆损失并对其进行改进,以适应元度量学习的学习方式,对查询集和支持集之间的相似性分数进行自适应加权,改善样本的相似性优化性能,从而提升模型的训练效果。
-
公开(公告)号:CN112685594B
公开(公告)日:2022-10-04
申请号:CN202011550159.2
申请日:2020-12-24
申请人: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
IPC分类号: G06F16/632 , G06F16/683 , G06F40/284 , G10L25/30
摘要: 本发明属于语音检索技术领域,特别涉及一种基于注意力的弱监督语音检索方法及系统,方法包含:提取文本关键词并转换为关键词特征向量,并对音频数据进行特征提取获取音频特征向量;使用注意力机制将关键词特征向量和音频特征向量进行融合,获取语音检索特征向量;将语音检索特征向量送入已训练优化的关键词识别模块识别,以检测文本关键词是否出现在语音数据中。本发明通过使用注意力机制来获得融合文本特征向量和音频特征向量的语音检索特征向量,使用弱监督标注数据即可训练优化识别模型,提升检索效率和准确性。
-
公开(公告)号:CN112685594A
公开(公告)日:2021-04-20
申请号:CN202011550159.2
申请日:2020-12-24
申请人: 中国人民解放军战略支援部队信息工程大学 , 郑州信大先进技术研究院
IPC分类号: G06F16/632 , G06F16/683 , G06F40/284 , G10L25/30
摘要: 本发明属于语音检索技术领域,特别涉及一种基于注意力的弱监督语音检索方法及系统,方法包含:提取文本关键词并转换为关键词特征向量,并对音频数据进行特征提取获取音频特征向量;使用注意力机制将关键词特征向量和音频特征向量进行融合,获取语音检索特征向量;将语音检索特征向量送入已训练优化的关键词识别模块识别,以检测文本关键词是否出现在语音数据中。本发明通过使用注意力机制来获得融合文本特征向量和音频特征向量的语音检索特征向量,使用弱监督标注数据即可训练优化识别模型,提升检索效率和准确性。
-
公开(公告)号:CN116644763A
公开(公告)日:2023-08-25
申请号:CN202310543688.7
申请日:2023-05-15
申请人: 中国人民解放军战略支援部队信息工程大学
IPC分类号: G06F40/58 , G06N3/0455 , G06N3/084 , G06N3/042 , G06N3/0895
摘要: 本发明属于自然语言处理技术领域,特别涉及一种构建基于双重知识蒸馏的机器翻译模型的方法及装置,该方法包括针对单语数据,将知识蒸馏和自训练相结合,构建单语数据的在线自蒸馏模块;针对双语数据,在交叉熵的损失函数基础上,将非参数知识蒸馏方法和自蒸馏相结合,构建双语数据的非参数知识蒸馏模块。针对双语数据,运用k近邻非参数知识蒸馏加入一致性损失的方式,实现更好的挖掘双语知识;针对单语数据,将知识蒸馏和自训练相结合提出一种自蒸馏的模型,实现更好的挖掘单语知识;两个模块相结合构成双重知识蒸馏的机器翻译模型,实现了更有效的挖掘双语数据和单语数据中的知识。
-
公开(公告)号:CN116611473A
公开(公告)日:2023-08-18
申请号:CN202310629724.1
申请日:2023-05-31
申请人: 中国人民解放军战略支援部队信息工程大学
IPC分类号: G06N3/045 , G06N3/0455 , G06N3/09 , G06N3/084
摘要: 本发明涉及人工智能应用技术领域,特别涉及一种面向序列任务的Transformer监督学习双重一致性正则化方法及系统,通过对训练输入序列添加扰动,得到用于模型训练的扰动序列数据;基于扰动序列数据确定基础模型训练损失、及基础模型和均值模型之间一致性损失,其中,基础模型为采用Transformer结构建模的序列任务端到端模型,均值模型为基于基础模型并利用指数移动平均值对基础模型反向传播更新参数进行迁移来获取的模型结构;基于基础模型训练损失和基础模型和均值模型之间一致性损失获取基础模型的整体训练损失;基于整体训练损失调整基础模型参数,得到目标序列任务端到端模型。本发明可提升序列生成模型鲁棒性,便于机器翻译、文本摘要等序列任务中应用。
-
公开(公告)号:CN116564287A
公开(公告)日:2023-08-08
申请号:CN202310637146.6
申请日:2023-05-31
申请人: 中国人民解放军战略支援部队信息工程大学
摘要: 本发明提供一种基于预训练模型和强化学习微调的半监督语音识别方法。该方法包括:采用编码器‑解码器模型作为语音识别模型,基于有标注数据集和无标注数据集,采用半监督训练方法对语音识别模型进行训练得到初始的语音识别模型和含伪标签的无标注数据集;将有标注数据集和含伪标签的无标注数据集进行合并,基于合并后的数据集采用强化学习方法对初始的语音识别模型进行微调得到最终的语音识别模型;将待识别的语音序列输入至训练好的语音识别模型,识别得到文本序列。
-
公开(公告)号:CN116825089A
公开(公告)日:2023-09-29
申请号:CN202310637126.9
申请日:2023-05-31
申请人: 中国人民解放军战略支援部队信息工程大学
摘要: 本发明提供一种基于互信息回报函数的语音识别微调方法。该方法包括:采用编码器‑解码器模型作为语音识别模型;采用有监督方法对语音识别模型进行训练得到初始的语音识别模型;采用强化学习方法对语音识别模型进行微调得到最终的语音识别模型;微调的过程具体包括:将编码器对输入的语音序列的状态编码序列作为环境状态,将解码器在每个时刻输出的文本符号作为动作、在每个时刻输出的概率作为策略函数,将语音序列本身的转移概率作为环境状态的转移概率;定义互信息回报函数并设计总的损失函数;采用小批量梯度下降算法对语音识别模型参数进行优化;将待识别的语音序列输入至训练好的语音识别模型,识别得到文本序列。
-
-
-
-
-
-
-
-
-