针对目标检测模型的对抗训练方法

    公开(公告)号:CN118966314A

    公开(公告)日:2024-11-15

    申请号:CN202411119125.6

    申请日:2024-08-15

    摘要: 本发明公开了一种针对目标检测模型的对抗训练方法,首先收集干净样本构成训练样本集将目标检测模型初步训练到收敛,然后依次生成置信度任务对抗样本集、分类任务对抗样本集和定位任务对抗样本集,并分别采用各个对抗样本集对目标检测模型进行对抗训练,在对抗训练时计算损失函数对目标检测模型中各个参数的梯度敏感度,将高梯度敏感度的参数进行更新,其他参数则不更新,循环以上过程进行对抗训练直到达到对抗训练结束条件。本发明通过拆分对抗训练任务并生成不同对抗样本进行参数更新,从而减轻不同任务之间的梯度冲突,在不增加网络容量的情况下,平衡目标检测模型在对抗样本上的鲁棒性和在干净样本上的准确率。

    一种基于隐音素检索的数字人口型多样性增强方法

    公开(公告)号:CN118921516A

    公开(公告)日:2024-11-08

    申请号:CN202411376512.8

    申请日:2024-09-30

    摘要: 本发明属于数字人口型动画合成技术领域,具体涉及一种基于隐音素检索的数字人口型多样性增强方法,用以增强数字人口型动画的真实性和多样性。具体而言,在传统的音素‑视素匹配方案中,由于音素和视素的类别数量受限于人为定义,导致从语音中提取的音素无法充分捕捉发音过程中的细微动态变化,进而影响了口型动画的自然流畅性。为了克服这一局限,本发明采用深度学习技术,对数字人的音视频素材进行预处理、特征提取,并构建了一个隐音素‑视素库。在实时交互中,通过音频隐音素的检索和匹配,实现了数字人口型动画的逼真和连贯性。本发明的优势在于其能够不断优化迭代,提高口型动画的连贯性和真实感。

    基于SAM模型的多模态医学图像分割方法及系统

    公开(公告)号:CN118537567B

    公开(公告)日:2024-10-29

    申请号:CN202411012059.2

    申请日:2024-07-26

    摘要: 本发明实施例公开了一种基于SAM模型的多模态医学图像分割方法及系统,所述方法包括:构建步骤:构建用于分割多模态医学图像的SAM模型,所述模型包括图像编码器、掩膜解码器、提示编码器、模态编码器和模态感知模块;训练步骤:使用交叉熵损失和Dice损失来训练所述SAM模型;分割步骤:所述SAM模型根据点击提示或者物体框提示输出对多模态医学图像中各个对象的分割结果。本发明通过引入轻量级的模态编码器和模态感知模块,实现了对SAM模型的多模态拓展,避免了对于每一种多模态任务都重新训练大模型的巨大计算开销,提升了医学图像的分割性能,从而实现了SAM在多模态医学图像分割任务中的高效应用,进而提高了诊断的准确性和可靠性。

    降噪方法、多层结构卷曲型复合吸声结构及吸声降噪方法

    公开(公告)号:CN118824219A

    公开(公告)日:2024-10-22

    申请号:CN202411032257.5

    申请日:2024-07-30

    摘要: 本发明涉及噪声控制技术领域,具体公开了一种降噪方法、多层结构卷曲型复合吸声结构及吸声降噪方法;所述吸声结构包括降噪结构单元、以及设置在降噪结构单元底部的底层单元;所述降噪结构单元包括多层依次层叠设置且用于对于不同频点噪声进行降噪的吸声降噪单元;多层所述吸声降噪单元位于底层单元的上方;每组所述吸声降噪单元设置有至少一组卷曲腔;声波进入吸声降噪单元内设置的卷曲腔内实现降噪。本发明在相同吸声面积下可设计出更多的吸声频点,提升吸声材料的低频性能,保证了高频性能衰减较少,从而使其整体吸声性能提升,且制作简单、降低了传统共振吸声结构在实际运用中的加工难度。

    基于啁啾扩频信号的反向散射通信感知一体化系统及方法

    公开(公告)号:CN118783996A

    公开(公告)日:2024-10-15

    申请号:CN202410930218.0

    申请日:2024-07-11

    发明人: 杨刚 吕琼 张波

    IPC分类号: H04B1/69 H04B1/7073 H04L27/00

    摘要: 本发明公开了一种基于啁啾扩频信号的反向散射通信感知一体化系统及方法,涉及无线通信技术领域;该系统包括啁啾扩频信号源、反向散射设备以及接收端;所述啁啾扩频信号源,用于发送啁啾扩频调制信号,所述啁啾扩频调制信号经反射链路到达反向散射设备,啁啾扩频调制信号由直接链路到达接收端;所述反向散射设备,对啁啾扩频调制信号进行调制后,将调制后的信号发射至接收端;所述接收端,用于实现信号的接收;该接收端对直接链路的信号进行解调,并进行反射链路的感知参数估计,实现对反射链路的信号解调;本发明的有益效果是:增大了通信范围和覆盖区域,可以实现远距离下对反向散射设备的感知。

    一种连续日内电力市场交易建模方法及计算机程序产品

    公开(公告)号:CN118761799A

    公开(公告)日:2024-10-11

    申请号:CN202411242619.3

    申请日:2024-09-05

    摘要: 本申请公开了一种连续日内电力市场交易建模方法及计算机程序产品,方法包括:根据包括连续日内电力市场的市场状态、储能商状态、可再生能源状态的系统状态以及扰动因子,构建状态保守马尔可夫决策模型,其中扰动因子根据可再生能源的预测误差确定;基于状态保守马尔可夫决策模型,通过状态保守策略优化框架构建智能体,其中智能体包括行动者网络和评论家网络;对智能体进行训练,更新评论家网络的网络参数和行动者网络的网络参数,直至期望累积奖励波动小于预设百分比时收敛,以获取使状态保守马尔可夫决策模型的期望累积奖励最大时的最优策略。本申请能够最大化当可再生能源的预测误差较大的情况时的期望累积奖励,减少受到的影响。

    一种任意类别的多目标跟踪方法、设备及存储介质

    公开(公告)号:CN118747763A

    公开(公告)日:2024-10-08

    申请号:CN202410819316.7

    申请日:2024-06-24

    摘要: 本发明涉及视频图像处理技术领域,尤其涉及一种任意类别的多目标跟踪方法,该方法包括:获取目标视频和目标跟踪模型,目标跟踪模型包括检测器、特征提取网络和相似度解码器;在目标视频的每帧视频图像中,通过检测器检测出视频图像中的每个目标物体的边界框得到视频图像的目标查询向量,通过特征提取网络提取出视频图像的目标特征图;通过相似度解码器,对目标查询向量和目标特征图进行融合处理,得到视频图像每个目标物体的新目标查询向量,根据目标跟踪模型的轨迹查询向量和每个目标物体的新目标查询向量,得到每个目标物体的目标物体信息。该方法在通用检测场景下进行任意类别的多目标跟踪,提升多目标跟踪性能和效率,提高多目标跟踪准确度。