词语索引模型和医学报告的生成方法、系统、设备和介质

    公开(公告)号:CN118398154B

    公开(公告)日:2024-09-10

    申请号:CN202410804636.5

    申请日:2024-06-21

    申请人: 安徽大学

    摘要: 本发明提供一种词语索引模型和医学报告的生成方法、系统、设备和介质。模型生成方法包括:获取医学影像集和对应的医学报告集,以及文本索引表和医学术语集;对医学报告集和医学术语集索引化处理,得到医学报告索引集和医学术语索引集;输入医学影像集至特征提取网络提取医学影像特征;将医学术语索引集和初始文本输入词嵌入网络获取文本特征和医学术语特征;将文本特征和医学术语特征、医学影像特征和医学术语特征输入融合网络得到对齐融合特征;输入对齐融合特征至预测网络得到预测文本序列集合;根据预测文本序列集合与索引化后的医学报告的差异度,更新模型参数,得到训练好的词语索引模型。提升了医学报告的准确度。

    基于运动信息辅助的遥感单目标跟踪方法及系统

    公开(公告)号:CN118015045A

    公开(公告)日:2024-05-10

    申请号:CN202410153260.6

    申请日:2024-02-02

    申请人: 安徽大学

    摘要: 本发明公开了基于运动信息辅助的遥感单目标跟踪方法及系统,方法包括:构建带有挖掘目标长期运动特征的长时运动信息挖掘模块的目标跟踪模型;训练所述目标跟踪模型;测试训练好的目标跟踪模型,实时获取目标跟踪结果;根据当前目标跟踪结果,判断目标是否遮挡和丢失,若是,则估计目标下一帧的位置,输出目标下一帧的位置,若否,则直接输出当前目标跟踪结果;本发明的优点在于:不容易丢失跟踪对象,鲁棒性强,具有全局表示能力。

    一种基于协调简单注意力机制的两阶段语音分离方法

    公开(公告)号:CN117711421A

    公开(公告)日:2024-03-15

    申请号:CN202311339818.1

    申请日:2023-10-17

    申请人: 安徽大学

    摘要: 本发明公开一种基于协调简单注意力机制的两阶段语音分离方法,获取说话者的视频数据集以及对应音频数据集,构造混合音频以及音频频谱图;构建基于协调简单注意力机制的两阶段语音分离模型;两阶段语音分离模型语音分离的推理过程中,先将预测的掩模与输入的频谱图相乘来预测语音频谱图,然后使用逆短时傅里叶反变换将其转换为最终分离的语音信号。本发明第一阶段先粗分离,第二阶段精细分离来去除第一阶段分离后音频存在其他音频噪声问题;针对分离后的音频存在部分音频片段缺失问题,本发明使用恢复融合模块来恢复缺失的音频片段;本发明提出协调简单注意力机制可以使音频和对应视觉信息更好地相关关联,以实现更精确的分离结果。

    基于软选择的自适应跨模态视觉跟踪方法

    公开(公告)号:CN114663470B

    公开(公告)日:2024-03-15

    申请号:CN202210094864.9

    申请日:2022-01-26

    申请人: 安徽大学

    摘要: 本发明公开了一种软选择的自适应跨模态视觉跟踪方法,属于计算机视觉技术领域,方法包括:从跨模态跟踪数据集中随机抽取一个测试序列;将测试序列作为跟踪网络的输入,对测试序列中目标进行跟踪;跟踪网络包括特征提取网络、软性选择模块、模型预测器和IoU网络,特征提取网络的输入为测试序列、输出与软性选择模块连接,软性模块的输出分别与模型预测器和IoU网络连接,软性选择模块用于自适应预测各模态对应的重要性权重并将权重与各模态对应特征图加权融合得到各模态的融合特征图。本发明通过设置软性选择模块来自适应预测各模态对应的重要性权重解决现有技术中跨模态跟踪中不同模态切换导致跟踪器性能下降的问题。

    一种多尺度跨平台行人重识别方法

    公开(公告)号:CN117671582A

    公开(公告)日:2024-03-08

    申请号:CN202311542794.X

    申请日:2023-11-15

    申请人: 安徽大学

    摘要: 本发明公开了一种多尺度跨平台行人重识别方法,包括:获取行人图片数据集,将行人图片数据集划分为训练集和测试集;采用ColorJitter函数,数据增强行人图片数据集中图像;建立初始跨平台行人重识别网络,将训练集中的图片分批输入初始跨平台行人重识别网络中,输出分类结果;通过总损失函数计算分类结果的损失,并利用梯度下降算法更新,以及通过反向传播优化初始跨平台行人重识别网络,获取优化跨平台行人重识别网络;将测试集输入至优化跨平台行人重识别网络中,获取识别精度;判断识别精度,若识别精度不满足要求,则重复训练过程,直至满足精度要求。通过本发明公开的多尺度跨平台行人重识别方法,能够用于不同平台的行人重识别。

    一种基于协同低秩图模型的RGBT目标跟踪方法及系统

    公开(公告)号:CN113658227B

    公开(公告)日:2024-02-20

    申请号:CN202110987298.X

    申请日:2021-08-26

    申请人: 安徽大学

    摘要: 一种基于协同低秩图模型的RGBT目标跟踪方法及系统,属于计算机视觉技术领域,解决现有技术的基于图模型的目标跟踪算法中相似性求解存在的可靠性低以及跟踪结果噪声高的问题;本发明的技术方案基于协同异质图模型的RGBT目标跟踪算法学习可靠的目标特征表示,改进基于图学习的方法中求解相似性矩阵的计算方式,学习到更可靠的相似性值,并且采用特征分解模型对原始输入特征进行分解,抑制噪声对跟踪结果的影响,同时对不同模态之间的异质性和协同性进行建模,有效利用不同模态的特征。

    基于CRNet的无人机视频车辆检测方法及系统

    公开(公告)号:CN117496459A

    公开(公告)日:2024-02-02

    申请号:CN202311512570.4

    申请日:2023-11-10

    申请人: 安徽大学

    摘要: 本发明提供基于CRNet的无人机视频车辆检测方法及系统,方法包括:采集得到差异场景视频数据,据以构建无人机视频时序序列;对差异场景视频数据,进行类别标注操作,以得到车辆类别标注数据;基于CRNet,将无人机视频时序序列作为模型输入数据,设置模型骨干网络时序增强模块,据以构建车辆检测识别模型;根据车辆检测识别模型,求取box损失、角度损失,以求取回归损失及分类损失,据以处理得到整体损失。本发明解决了难以排除运动模糊、随机遮挡以及密集分布的不利影响,以及对细粒度目标分类能力差的技术问题。