-
公开(公告)号:CN119379524B
公开(公告)日:2025-05-06
申请号:CN202411918332.8
申请日:2024-12-25
Applicant: 齐鲁工业大学(山东省科学院) , 山东省人工智能研究院 , 山东省计算中心(国家超级计算济南中心) , 山东大学 , 浙江大华技术股份有限公司 , 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 合肥工业大学
IPC: G06T1/00 , G06N3/0455 , G06N3/0475 , G06N3/09 , G06N3/094
Abstract: 本发明涉及一种基于多重水印融合与跨域学习的图像伪造主动防御方法,属于计算机视觉技术领域。其包括以下步骤:获取待处理图像;待处理图像经过水印编码器进行不可见水印嵌入和可见水印嵌入,分别得到嵌入不可见水印的图像和嵌入可见水印的图像;嵌入不可见水印的图像经过噪声层进行处理,得到噪声图像;嵌入可见水印的图像经过噪声层进行处理,通过可见水印联合优化在嵌入随机噪声的图像位置产生明显的虚假警示标识;噪声图像经过水印解码器进行图像的溯源和检测,判断图像的真实性;进行损失函数监督训练。本发明方法能够精准的判断图像是否经过深度伪造以及验证图像来源的真实性。
-
公开(公告)号:CN119379524A
公开(公告)日:2025-01-28
申请号:CN202411918332.8
申请日:2024-12-25
Applicant: 齐鲁工业大学(山东省科学院) , 山东省人工智能研究院 , 山东省计算中心(国家超级计算济南中心) , 山东大学 , 浙江大华技术股份有限公司 , 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 合肥工业大学
IPC: G06T1/00 , G06N3/0455 , G06N3/0475 , G06N3/09 , G06N3/094
Abstract: 本发明涉及一种基于多重水印融合与跨域学习的图像伪造主动防御方法,属于计算机视觉技术领域。其包括以下步骤:获取待处理图像;待处理图像经过水印编码器进行不可见水印嵌入和可见水印嵌入,分别得到嵌入不可见水印的图像和嵌入可见水印的图像;嵌入不可见水印的图像经过噪声层进行处理,得到噪声图像;嵌入可见水印的图像经过噪声层进行处理,通过可见水印联合优化在嵌入随机噪声的图像位置产生明显的虚假警示标识;噪声图像经过水印解码器进行图像的溯源和检测,判断图像的真实性;进行损失函数监督训练。本发明方法能够精准的判断图像是否经过深度伪造以及验证图像来源的真实性。
-
公开(公告)号:CN118447880A
公开(公告)日:2024-08-06
申请号:CN202410640457.2
申请日:2024-05-22
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明提供了一种基于多特征注意力融合的语音情感识别方法及系统,包括:基于获取的待识别语音信号,通过预处理获得语音信号的语谱图和梅尔频率倒谱系数;基于所述语谱图,通过时频特征提取获得语谱图特征;基于所述梅尔频率倒谱系数,利用预先训练的神经网络模型进行特征提取,获得梅尔频率倒谱系数特征;基于待识别语音信号,利用自动语音识别的预训练模型进行特征提取,获得W2E特征;分别将语谱图特征和W2E特征以及梅尔频率倒谱系数特征和W2E特征进行特征融合,获得第一融合特征和第二融合特征;基于所述第一融合特征和第二融合特征,通过全局融合获得最终的融合特征;基于获得的融合特征,利用预先训练的情感分类器,获得情感分类结果。
-
公开(公告)号:CN118016081A
公开(公告)日:2024-05-10
申请号:CN202410423860.X
申请日:2024-04-10
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本公开提供了基于语音质量分级模型的变速率语音编码方法及系统,涉及语音信号处理技术领域,包括:获取编码器不同误码率下得到的合成语音文件;将所述合成语音文件输入至语音质量分级模型中,得到语音质量的预测结果;对未来可能出现的语音质量的变化情况进行模态划分;其中,语音质量的变化情况包括三种模态,分别为平衡态、休眠态以及激活态;判断当前预测出的语音质量的所属模态,并根据当前所属模态,实时地对语音编码的速率进行自适应调整,在语音编码的自然度、可懂度和系统容量间得到最佳平衡。
-
公开(公告)号:CN117934914A
公开(公告)日:2024-04-26
申请号:CN202311830648.7
申请日:2023-12-27
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G06V10/764 , G06V10/82 , G06N3/0475 , G06N3/094 , G06N3/084 , G06N3/09 , G06N3/096
Abstract: 本发明公开一种基于数据增强和最大绝对差异的对抗样本生成方法及系统,该方法包括:预处理原始图像,得到被攻击图像;创建初始扰动图像,开始迭代;基于被攻击图像,获得并调整多张局部图像,结合扰动图像,对被攻击图像和多张局部图像进行数据增强处理;将数据增强处理后的图像输入至分类网络模型中,计算全局特征与多个局部特征之间的最大绝对差异损失值,并计算分类器损失值,综合得到总损失值,通过反向传播获取损失函数梯度信息;计算得到最终的图像梯度信息,生成并更新扰动图像;判断是否达到最大迭代次数,若是,则对被攻击图像叠加更新后的扰动图像,生成对抗样本;反之则迭代更新扰动图像。本发明能够有效提高生成对抗样本的迁移率。
-
公开(公告)号:CN117877521A
公开(公告)日:2024-04-12
申请号:CN202410021090.6
申请日:2024-01-04
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明提出了基于数据增强的无监督机械声音异常识别方法及系统,通过对采集的正常音频数据提取对数梅尔谱图,并对对数梅尔谱图进行数据增强处理,用于识别模型的训练,增强了识别模型对于复杂故障模式的识别能力,并提高了其对于未知故障类型的泛化能力;在识别模型中通过添加自注意力机制捕捉长距离依赖,能够关注到输入特征图中相距较远的区域间的关系,提高特征提取和特征表达能力。
-
公开(公告)号:CN117219120A
公开(公告)日:2023-12-12
申请号:CN202311000370.0
申请日:2023-08-09
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明公开一种基于时频域音频增强的机械设备异常检测方法及系统,包括:获取正常运行音频信号,提取幅度谱和相位谱,对幅度谱进行增强处理,将增强后的幅度谱与相位谱合并得到正常运行音频增强信号;对正常运行音频增强信号提取频谱特征,对卷积自编码器网络进行训练;对待测运行音频信号进行增强处理后得到待测运行音频增强信号,根据待测运行音频增强信号采用训练后的卷积自编码器网络得到待测运行音频重构信号,根据待测运行音频重构信号与待测运行音频增强信号间的重构误差得到异常检测结果。通过对音频信号进行增强,使得采集到的机械设备运行音频更加接近于机械设备本身,更利于异常声音检测而不会发生误判。
-
公开(公告)号:CN116758451A
公开(公告)日:2023-09-15
申请号:CN202310601381.8
申请日:2023-05-24
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明属于情感计算技术领域,提供了基于多尺度和全局交叉注意力的视听情感识别方法及系统,通过多尺度卷积注意力模块,提取不同上下文尺度的模态关键情感特征,弥补了单一尺度特征不足以表达人类复杂情感的缺陷。通过全局交叉注意力模块,同时考虑模态间和模态内的交互,从而学习更丰富的模态交互信息,并且减少了融合特征中的冗余。最后又设计了多尺度特征学习模块,从融合特征中进一步学习对两个模态共同有意义的情感信息。通过以上改进,最终所提出的方法能够实现更好的情感识别准确率和更高效的情感识别效率。
-
公开(公告)号:CN115171710B
公开(公告)日:2024-10-29
申请号:CN202210799728.X
申请日:2022-07-08
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
IPC: G10L21/007 , G10L21/0224 , G10L21/0232 , G10L19/02 , G10L25/63 , G06N3/045 , G06N3/0464 , G06N3/094 , G06N3/0475 , G06N3/084 , G10L25/30
Abstract: 本发明属于语音信号处理的语音增强技术领域,提供了一种基于多角度判别的生成对抗网络的语音增强方法及系统。该方法包括,获取带噪声语音信号;基于带噪声语音信号,采用训练好的生成对抗网络,得到增强后的语音信号;其中,所述生成对抗网络包括一个生成器和四个判别器。本发明的多角度判别包括:增强后语音信号、干净语音与情绪语音之间的差异;同时添加从频域判别学习增强后语音信号、干净语音与情绪语音之间的频域差异。本发明从不同语音信号的语音成分进行判别,以及语音的时域频域角度,能够从不同角度充分学习语音成分,为生成器提供足够多的反馈信息,可以有效改善语音失真,提高增强后语音的语音质量。
-
公开(公告)号:CN116884433A
公开(公告)日:2023-10-13
申请号:CN202310806300.8
申请日:2023-07-03
Applicant: 山东省计算中心(国家超级计算济南中心) , 齐鲁工业大学(山东省科学院)
Abstract: 本发明提供了一种基于图注意力的伪造语音检测方法及系统,通过预加重及自监督预训练模型和单分类学习,弥补了假语音层出不穷、训练数据不足的缺陷;在提取高级特征表示时,对通道分配注意力,捕获了更加丰富的通道信息;在使用图计算进行图建模时关注到信息量更丰富的频域子带和时域段;在多级协同异构图注意力融合机制中,充分考虑时域和频域信息的影响和交互,实现了更高效率、更强泛化性能和更准确识别率的伪造语音检测。
-
-
-
-
-
-
-
-
-