-
公开(公告)号:CN117912488A
公开(公告)日:2024-04-19
申请号:CN202410129476.9
申请日:2024-01-30
Applicant: 合肥工业大学
IPC: G10L25/18 , G10L25/21 , G06N3/0464 , G06N3/045
Abstract: 本发明提供一种通用音频篡改定位方法、系统、存储介质和电子设备,涉及数字音频技术领域。本发明基于预设的深度学习框架,包括:首先,提取音频信号的Mel谱图作为检测特征,设计了密集连接卷积网络和通道‑空间注意力机制结合增强特征,又引入了自主注意力机制与实际的篡改检测任务相呼应,以增强篡改区域和真实区域的特征差异,最大化的提取特征信息;同时,在解码阶段将浅层特征与深层特征相融合来提高网络的性能;最后,使用自适应阈值来进行预测掩码的精细化,实现在一个网络框架内检测多种篡改类型音频并对篡改区域进行定位。
-
公开(公告)号:CN117151409A
公开(公告)日:2023-12-01
申请号:CN202311172684.9
申请日:2023-09-11
Applicant: 合肥工业大学
IPC: G06Q10/0631 , G06N20/00
Abstract: 本发明提供用于路网抢修与物资配送的联合调度方法和系统,涉及联合调度领域。相比于现有技术,本发明提供的技术方案通过根据强化学习中的Q学习算法进行了改进,提出了基于双层交互Q学习的路网抢修和物资配送联合调度方法,可以将目标函数下的联合调度决策反馈至抢修队与运输队,使两者可以同时做出有利于应急响应的决策,从而达到联合调度的目的,并有效降低求解耗费的时间。
-
公开(公告)号:CN116524936A
公开(公告)日:2023-08-01
申请号:CN202310413563.2
申请日:2023-04-12
Applicant: 合肥工业大学
Abstract: 本发明提供了一种基于StarGAN‑VC的声纹认证方法和系统,涉及声纹认证领域。该方法包括:通过将原始注册音频作为训练样本,对StarGAN‑VC网络架构中的生成器网络进行迭代训练,基于不同的迭代训练次数,分别得到第一生成器网络和第二生成器网络。并通过第二生成器网络对原始注册语音信号进行转化,转化为第一注册音频信号,使得第一注册音频信号与原始注册语音信号具有一定的差异,保障了原始注册语音信号的声纹隐私的安全性。由于在StarGAN‑VC网络架构中生成器对语音信号转化过程,无法得知转化过程中的具体转化手段,提高了语音信号转化的机密性,为用户的原始声纹特征信息的声纹隐私安全性提供了可靠保障。
-
公开(公告)号:CN111508524B
公开(公告)日:2023-02-21
申请号:CN202010148882.1
申请日:2020-03-05
Applicant: 合肥工业大学
Abstract: 本发明提供一种语音来源设备的识别方法和系统,涉及语音信息处理技术领域。本发明通过获取包含自然噪声的语音数据库;提取语音数据库中的语音样本的LMFB特征;基于改进的TCN网络学习深度语音特征,并利用LDA对其进行优化;最后基于深度语音特征LMFB‑TCN‑LDA对SVM分类器进行训练和测试,得到语音来源设备识别模型。本发明通过用包含自然噪声的语音样本的深度语音特征LMFB‑TCN‑LDA训练和测试SVM分类器,得到的语音来源设备识别模型能准确识别出包含自然噪声的语音的来源设备的语音来源设备识别模型,同时,本发明基于改进的TCN网络和LDA对LMFB特征进行深度语音特征学习,使得提取的LMFB‑TCN‑LDA特征更加反应设备本身特性,从而进一步提高语音来源设备识别模型的识别准确率。
-
公开(公告)号:CN111402921B
公开(公告)日:2023-01-24
申请号:CN202010173725.6
申请日:2020-03-13
Applicant: 合肥工业大学
Abstract: 本发明提供一种语音复制粘贴篡改检测方法和系统,涉及语音信息处理技术领域。本发明通过带有精英选择策略的遗传算法提取CQSD特征中比较干净的eGA‑CQSD特征,除去CQSD特征中干扰信息,从而达到语音信息在遭受到不同形式的常见攻击时,检测结果的的准确率受到的影响较小,即提高语音复制粘贴篡改检测方法在遭受攻击时的准确度。
-
公开(公告)号:CN114360580A
公开(公告)日:2022-04-15
申请号:CN202111471209.2
申请日:2021-12-03
Applicant: 合肥工业大学
Abstract: 本发明提供一种基于多特征决策融合的音频copy‑move篡改检测与定位方法、系统、存储介质和电子设备,涉及数字音频技术领域。本发明包括计算待检测视频中每个字节的多种典型特征,并比较任意两个字节的同种典型特征的相似度,直至两两比较完毕,获取完整的相似度比较结果;所述多种典型特征至少包括基音频率特征、颜色自相关图特征和短时能量特征,即分别从频域、空间域、时域三个不同域提取最典型的特征,可以在一定程度上保证单特征的检测准确率;融合所述完整的相似度比较结果,完成所述待测音频文件的copy‑move篡改检测与定位,基于多特征决策融合可进一步提高定位的精准度,实现准确定位篡改的具体位置。
-
公开(公告)号:CN109240927B
公开(公告)日:2021-11-12
申请号:CN201811063044.3
申请日:2018-09-12
Applicant: 合肥工业大学
Abstract: 本发明实施例公开一种基于GDE3的多阶段动态多目标测试资源分配方法,包括:获取多阶段动态多目标优化模型;应用GDE3算法对多阶段动态多目标优化模型进行优化;在当前阶段通过GDE3算法获得一个最优解集时,对下一阶段种群初始化。本发明实施例的基于GDE3的多阶段动态多目标测试资源分配方法,获取多阶段动态多目标优化模型,应用GDE3算法对多阶段动态多目标优化模型进行优化,在当前阶段通过GDE3算法获得一个最优解集时,对下一阶段种群初始化。从而利用多阶段反馈的思想使方案更加贴近实际的软件测试,实现多目标使方案更能适应不断发展的软件系统。
-
公开(公告)号:CN113506580A
公开(公告)日:2021-10-15
申请号:CN202110466229.4
申请日:2021-04-28
Applicant: 合肥工业大学
IPC: G10L19/018
Abstract: 本发明提供的一种抗任意剪切和翻录的音频水印方法及系统,涉及音频水印技术领域。本发明的技术方案针对待嵌入水印的音频,首先提取待嵌入水印的音频的音频特征,并对所述音频特征进行修改和量化以获取特征值序列和量化特征序列,基于扩频技术将所述特征值序列写回待嵌入水印的音频中获取经过特征强化后的音频,然后基于m序列将水印与所述量化特征序列进行绑定。该技术方案将m序列与DWT‑DCT‑SVD域的水印技术相结合,通过该法嵌入至音频的水印可在音频遭受极大破坏的情况下仍能完整性恢复。
-
公开(公告)号:CN109003615B
公开(公告)日:2020-12-25
申请号:CN201810982577.5
申请日:2018-08-27
Applicant: 合肥工业大学
IPC: G10L19/018 , G10L19/038
Abstract: 本发明提供一种语音流嵌入信息的方法及装置、语音流解码信息的方法及装置,本发明根据语音帧确定目标增益值,继而根据目标增益值和第二增益量化表以及要嵌入的比特位确定第二目标索引或第三目标索引,从而实现信息的嵌入。上述技术方案隐写容量相对较高,能抵抗一般的隐写分析检测,并且合成语音的嵌入失真较小,语音质量客观评估和主观评估效果都较好。
-
公开(公告)号:CN110147652A
公开(公告)日:2019-08-20
申请号:CN201910402628.7
申请日:2019-05-15
Applicant: 合肥工业大学
IPC: G06F21/10 , G06F16/61 , G06F16/68 , G06Q40/04 , G10L19/018
Abstract: 本发明提供一种基于区块链和数字水印的音乐版权保护方法和系统,涉及数字版权管理技术领域。包括以下步骤:获取用户信息和所述用户信息对应的音频文件A;上传所述用户信息和所述音频文件A;对所述音频文件A进行检验,若检测出所述音频文件A中已含有数字水印,则不进行处理;若检测出所述音频文件A中未含有数字水印,则将所述用户信息嵌入所述音频文件A中,获取音频文件B;将所述音频文件B存储在数据库中,将所述用户信息和所述音频文件B的Hash值打包处理,得到版权信息;将所述版权信息存储在比特币区块链的交易记录中,将包含所述版权信息的交易记录存储在以太坊私链中。本发明解决了音频文件在流通过程中无法提供版权信息的问题。
-
-
-
-
-
-
-
-
-