-
公开(公告)号:CN118194882A
公开(公告)日:2024-06-14
申请号:CN202410005400.5
申请日:2024-01-03
Applicant: 华东师范大学
IPC: G06F40/58 , G06N3/0442 , G06N3/0455 , G06N3/0985 , G06F40/30 , G06F18/25 , G06F16/783
Abstract: 本发明涉及多模态融合技术领域,具体为一种视频辅助的多模态机器翻译方法,该方法包括如下步骤:构建多模态翻译模型结构,并通过超参数和随机变量对所述多模态翻译模型初始化;获取多模态数据集,所述多模态数据集包括视频与双语平行语料;依据所述多模态数据集对所述多模态翻译模型结构进行训练,以获得多模态翻译模型的最佳参数;通过所述最佳参数获得目标多模态翻译模型,并获得最佳翻译结果。本发明通过跨模态注意力机制和门控机制来构建多模态翻译模型,能够深入挖掘视频与文本之间的语义关联,实现深层次的语义融合,能够更准确地传达信息,显著提升机器翻译结果的准确率。
-
公开(公告)号:CN117576649B
公开(公告)日:2024-04-30
申请号:CN202311799873.9
申请日:2023-12-26
Applicant: 华东师范大学
Abstract: 本发明涉及计算机技术领域,具体为一种基于分割点和双特征增强的车道线检测方法,该方法包括如下步骤:根据特定网络提取图片特征,并获得多尺度特征图;依据所述多尺度特征图得到车道线特征点坐标集合;基于所述多尺度特征图和所述车道线特征点坐标集合设置车道线特征增强模型;利用所述车道线特征增强模型优化车道线特征,以获得最优车道线特征;依据所述最优车道线特征获得预测车道线。本发明提取车道线的特征点,利用车道线特征增强模型对车道线特征点进行逐步优化,以获得最优的车道线特征,进而构建出更加准确的车道线实例。
-
-
公开(公告)号:CN116844086A
公开(公告)日:2023-10-03
申请号:CN202310786548.2
申请日:2023-06-30
Applicant: 华东师范大学
IPC: G06V20/40 , G06V20/54 , G06V10/774 , G06V10/74
Abstract: 本发明公开了一种基于视频片段显著性引导的交通事故检测方法,其特点是该方法包括:采集城市道路交通数据集,并对其进行训练集和测试集的分割;视频片段的相似度显著性预处理;设计由该显著性引导的注意力模型;设计基于动态时间规整算法的损失函数正则化方法;对设计的网络进行充分的训练等步骤。本发明与现有技术相比具有为多示例学习算法提供了更加健壮的视频动作聚合特征,以增强交通异常的检出能力,提高异常检测性能,有效地应对异常检测任务中的数据稀疏性和数据标签缺失问题,从而对于基于MIL框架的弱监督视频交通事故检测任务取得了比基线算法更好的检测效果,解决了常规的弱监督视频检测算法难以应用到交通场景中的问题。
-
公开(公告)号:CN116824204A
公开(公告)日:2023-09-29
申请号:CN202310364700.8
申请日:2023-04-07
Applicant: 华东师范大学
IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06V10/80 , G06N3/0464 , G06N3/048 , G06N3/08 , G16H30/20
Abstract: 本发明公开了一种基于语义空间注意力的病理图像分类方法,该方法通过提取语义信息并融入注意力机制实现对病理图像的分类。本发明考虑到病理图像中细胞区域占比少,可以通过在相同语义区域内充分交互信息,加强对细胞区域的专注。本发明的创新点在于从信息交互的角度,融入了语义信息并指导注意力,构建了基于语义级别的空间注意力机制,打破了原先基于像素级别的空间注意力信息交互的区域局限性。本发明的病理图像分类框架由语义信息提取网络模型和空间注意力机制组成,同时推导了语义信息提取网络模型的建模过程和空间注意力生成过程,给出了详细的应用方案。
-
公开(公告)号:CN114897914B
公开(公告)日:2023-07-07
申请号:CN202210259206.0
申请日:2022-03-16
Applicant: 华东师范大学
IPC: G06T7/11
Abstract: 本发明涉及图像处理技术领域,具体涉及一种基于对抗训练的半监督CT图像分割方法,包括以下步骤:首先获取肺部的三维CT图像,建立体素级标注的患病数据集、未标注的患病数据集及健康数据集;接着将三种数据集中的CT图像依次输入给生成器和分割器,分别得到合成的健康图像和分割掩码。然后将合成的健康图像的掩码区域和输入图像的反掩码区域拼接得到恢复的健康图像;合成的健康图像的掩码区域的值设为0得到反掩码图像。最后以对抗训练的方式让两个判别器分别监督恢复的健康图像和反掩码图像,来提高分割器的分割和生成器的效果。本发明实现了使用少量体素级标记样本来得到性能准确的分割模型,特别设计的分割器有效地提高了特征表示能力。
-
公开(公告)号:CN116363461A
公开(公告)日:2023-06-30
申请号:CN202310356664.0
申请日:2023-04-04
Applicant: 华东师范大学
IPC: G06V10/774 , G06V10/764 , G06V10/82 , G06N3/047 , G06N3/0464 , G06N3/08 , G06T7/00
Abstract: 本发明公开了一种多视图儿童肿瘤病理图像分类的深度网络增量学习方法,该方法首先对儿童肿瘤病理图像特征进行建模,然后在不断获得新数据的情况下,训练得到增量学习模型,由此提高其准确性并获得鲁棒的分类能力。本发明的创新点在于针对医学病理图像的特点进行了设计,提出了一种多层级知识蒸馏正则化方法,以缓解增量学习中的旧模型在新数据上适应时的灾难性遗忘问题,增加算法的鲁棒性和可靠性。本发明的方法可以应用于医学图像处理领域以及其他需要增量学习的任务中。
-
公开(公告)号:CN115877952A
公开(公告)日:2023-03-31
申请号:CN202310000924.0
申请日:2023-01-03
Applicant: 华东师范大学
IPC: G06F3/01
Abstract: 本发明公开了一种基于FOC和MPC算法的触控手套力传感方法,其特征在于该触控手套力传感方法由FOC算法具有的电流MPC计算模块,反Park变换模块,Clark变换模块,Park变换模块,SVPWM生成模块以及扩展卡尔曼滤波组成,通过算法模块的SPI接口接收不同物体输入到MCU的力传感数据并进行参数配置,实现对单指触控手套手指处的力传感,将算法集成为FOC力传感控制芯片安装在触控指套上,为触控指套手指处的力传感提供精确的电机控制。本发明与现有技术相比具有结构简单,控制更加精准,提高了FOC算法的动态响应和参数鲁棒性,是一种理想的VR触控手套需要的力传感方法。
-
公开(公告)号:CN115731178A
公开(公告)日:2023-03-03
申请号:CN202211454389.8
申请日:2022-11-21
Applicant: 华东师范大学
IPC: G06T7/00 , G06V10/26 , G06V10/774 , G06V10/82 , G06N3/0475 , G06N3/088 , G06N3/094 , G06N3/084 , G06N3/048
Abstract: 本发明公开了一种跨模态的无监督域自适应医学图像分割方法,其特点是采用一致性正则化和不确定性估计来增强源模态和目标模态之间的图像对齐和特征对齐,实现跨模态的无监督域自适应医学图像分割,具体包括:1)数据预处理;2)迭代训练和参数更新;3)分割模型的获取;4)分割结果的获取;5)分割结果的评价等步骤。本发明与现有技术相比具有在不使用任何目标域标注的情况下可以学习到两个模态间共有的特征,并且在源模态和目标模态图像上都有较好的分割效果,有效解决了医学图像中的域迁移问题,使预测的分割图更加鲁棒,更具保真度。
-
公开(公告)号:CN115658954A
公开(公告)日:2023-01-31
申请号:CN202211334028.X
申请日:2022-10-28
Applicant: 华东师范大学
IPC: G06F16/583 , G06F16/55 , G06N3/094 , G06V10/74 , G06V10/764 , G06V10/774
Abstract: 本发明公开了一种基于提示学习的跨模态检索对抗防御方法,本发明的创新点在于在针对图像‑文本的跨模态检索任务中,利用提示学习,在使用视觉与语言预训练模型的基础上,使用对抗样本来训练将文本输入转化为向量表示的提示模板,提高跨模态检索在受到对抗样本攻击下的鲁棒性。本发明使用一种称为CLIP的图像与语言多模态预训练模型获得图像的潜表示,并设计适合于图像‑文本跨模态检索任务的提示模板,使用少量图像对抗样本对其进行训练,以获得文本输入的鲁棒向量表示,从而提升跨模态检索方法在对抗样本攻击下的鲁棒性,达到对抗防御效果。本发明不需要改变预训练模型的参数,所需训练数据较少,训练时间消耗低。
-
-
-
-
-
-
-
-
-