-
公开(公告)号:CN114549322B
公开(公告)日:2024-04-16
申请号:CN202210183404.3
申请日:2022-02-24
申请人: 中山大学
IPC分类号: G06T3/4046 , G06T3/4053 , G06N3/088
摘要: 本申请公开了一种基于无监督领域自适应的图像超分辨方法及装置,在源域能访问到成对的LR和HR数据,目标域仅能访问到LR数据的情况下,实现源域模型到目标域的迁移,通过设计两个对称的分支网络(源分支网络和目标分支网络),共同处理源域和目标域数据,并采用域间对抗自适应机制,通过不同域之间的对抗实现域间迁移;采用域内对抗自适应机制,通过域内对抗实现两个分支之间的对齐,同时添加重建一致性约束和VGG损失,以确保训练过程的稳定性,从而使适应到目标域的SR网络存在性能稳定。
-
公开(公告)号:CN117809017A
公开(公告)日:2024-04-02
申请号:CN202311537610.0
申请日:2023-11-17
申请人: 中山大学
IPC分类号: G06V10/25 , G06V10/44 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/0895 , G06N3/096
摘要: 本发明公开了一种基于对比学习的开放场景半监督物体检测方法与系统。包括:准备标签数据和无标签数据,构建包含对比学习模块的Faster‑RCNN模型;利用所述标签数据对所述包含对比学习模块的Faster‑RCNN模型进行预训练,直到该模型收敛,并将所述包含对比学习模块的Faster‑RCNN模型复制为两份,得到Teacher模型和Student模型;利用所述标签数据和所述无标签数据,所述Teacher模型和所述Student模型进行对比学习直到Teacher模型收敛,形成最终的Teacher模型;用户输入待进行物体检测的图像到所述最终的Teacher模型中,得到物体检测结果。本发明能够充分利用无标签数据中潜在的前景物体、有效降低了无标签数据中隐含的OOD样本对半监督训练过程带来的有害影响,增加了模型的鲁棒性,有效提升模型的检测性能。
-
公开(公告)号:CN111984772B
公开(公告)日:2024-04-02
申请号:CN202010719316.1
申请日:2020-07-23
申请人: 中山大学
IPC分类号: G06F16/332 , G06F16/583 , G06F18/25 , G16H50/70
摘要: 本发明公开一种基于深度学习的医疗影像问答方法及系统,所述方法包括:采用多任务预训练方法,利用非医疗影像问答数据训练视觉编码器;导入预先训练好的模型权重,获取医疗影像以及对应的问题;通过视觉编码器提取医疗影像的视觉特征,并根据视觉特征图的尺寸,定义空间特征;通过文本编码器提取文本特征;通过跨模态自注意力模块对视觉、空间和文本特征进行融合,得到多模态特征;将多模态特征输入多层感知机中推断出估计的答案;根据估计的答案和实际的答案、估计的医疗影像类型和实际的医疗影像类型计算损失,更新模型参数;采用不同的医疗影像和不同的问题多次迭代式地进行上述过程直至符合停止条件。本发明能够提升医疗影像问答的准确率。
-
公开(公告)号:CN113469958B
公开(公告)日:2023-08-04
申请号:CN202110676360.3
申请日:2021-06-18
申请人: 中山大学附属第一医院
IPC分类号: G06T7/00 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/0442
摘要: 本发明涉及医疗人工智能技术领域,尤其涉及一种胚胎发育潜能预测方法、系统、设备及存储介质,包括:将所述胚胎初始图像输入囊胚预测模型,得到胚胎特征向量;将所述胚胎特征向量输入双向长短期记忆网络,得到胚胎发育特征;基于跨模态特征融合机制,根据临床数据及所述胚胎发育特征,得到融合特征;将所述融合特征输入第一多层感知器,预测得到胚胎妊娠率。本发明通过分析早期拍摄的多焦段胚胎视频,利用多焦段选择模型以及时间转移模型得到具有时空特性的融合特征,从而实时预测体外培养的胚胎妊娠率,提高了预测的准确度;同时本发明通过预测囊胚形成概率以及整倍体概率,辅助医生进行早期胚胎筛选,从而减少人力成本。
-
公开(公告)号:CN111274438B
公开(公告)日:2023-06-23
申请号:CN202010040451.3
申请日:2020-01-15
申请人: 中山大学
摘要: 本发明公开了一种语言描述引导的视频时序定位方法,包括如下步骤:步骤S1,提取跨模态特征的多模态特征编码网络,以用于学习视频和自然语言的跨模态信息,获得所输入的语言和视觉模态的多模态融合表征;步骤S2,采用层次化的树状结构策略,对跨模态信息进行层次化分解;步骤S3,采用渐进强化学习机制,通过两个任务导向的奖励来提供正确的学分分配,鼓励树状结构中的不同策略的相互促进,本发明通过基于树结构的渐进强化学习框架来模拟人类由粗到精的决策过程,可以有效地分解复杂的动作策略,在增加搜索空间的同时减少搜索步骤的数量,以更合理的方式获得更令人印象深刻的结果。
-
公开(公告)号:CN110705344B
公开(公告)日:2023-03-28
申请号:CN201910772643.0
申请日:2019-08-21
申请人: 中山大学
IPC分类号: G06V20/52 , G06V20/40 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明公开了一种基于深度学习的人群计数模型及其实现方法,所述方法包括:步骤S1,获取人群图像,对获取的人群图像进行预处理并利用标注信息产生对应的人群密度图;步骤S2,将输入的人群图像缩放成多个尺度版本,通过多个子网络提取各个尺度的特征,并利用特征增强模块增强各个尺度的特征;步骤S3,将多个子网络产生的特征结合,生成估计的人群密度图;步骤S4,利用估计的人群密度图与真实的人群密度图计算损失,更新模型参数;步骤S5,利用不同人群图像多次迭代式地进行步骤S1‑S4的训练过程,直到符合停止的条件。
-
公开(公告)号:CN113077281B
公开(公告)日:2023-02-17
申请号:CN202110270766.1
申请日:2021-03-12
申请人: 中山大学
摘要: 本发明公开了一种地铁客流量分布预测方法以及设备,本发明通过将OD客流量分布中未完成的订单信息作为输入的一部分,与已完成的订单信息一起输入OD客流量分布预测子模型进行预测,从而在对未来的客流量分布预测中考虑了未完成的订单信息。并且,本发明实施例通过将OD第一分布特征隐藏状态和DO第一分布特征隐藏状态进行融合后获得融合特征,从而充分发掘了OD客流量分布与DO客流量分布在预测中相互之间的指导作用,使得地铁客流量分布预测模型输出的预测结果能够准确完整地反映客流量的真实分布情况。
-
公开(公告)号:CN113094422A
公开(公告)日:2021-07-09
申请号:CN202110273734.7
申请日:2021-03-12
申请人: 中山大学
摘要: 本发明公开了一种城市道路交通流量图生成方法、系统及设备。本发明通过将第一编码器生成交通路网特征图以及第二编码器生成的第二交通流量特征图输入到解码器中进行解码,生成第三交通流量特征图,并基于第一交通流量特征图以及第三交通流量特征图,生成细粒度交通流量图。本发明通过将第一编码器生成交通路网特征图作为生成细粒度交通流量图的先验知识,并在解码器中显式编码先验知识,充分发挥了先验知识在生成细粒度交通流量图中的指导作用,充分发掘了城市交通流量分布模式,在高清晰度的城市交通流量图生成任务上能取得优越的性能和准确度。
-
公开(公告)号:CN111539292A
公开(公告)日:2020-08-14
申请号:CN202010306319.2
申请日:2020-04-17
申请人: 中山大学
摘要: 本发明公开了一种用于具现化场景问答任务的动作决策模型及方法,所述模型包括:预训练特征提取模组单元,用于对当前时间节点下的多模态输入特征分别进行提取;特征融合单元,用于将由多模态中提取出来的各个特征进行融合形成融合特征;融合特征解码单元,用于将当前时间节点融合特征向量解码为动作空间下的概率分布序列;时序融合动作决策单元,用于将当前及先前时间节点所获得的动作空间下的概率分布序列进行融合,根据融合得到的动作决策向量中的最大值对应的动作做出当前的动作决策。
-
公开(公告)号:CN111027634A
公开(公告)日:2020-04-17
申请号:CN201911294804.6
申请日:2019-12-16
申请人: 中山大学
摘要: 本发明公开了一种基于类激活映射图引导的正则化方法及系统,该方法包括:S1,利用深度神经网络的全局池化层及全连接层参数产生基于标签类别的通道权重因子及类激活映射图;S2,将生成的通道权重因子及类激活映射图分别根据其对神经网络中各层特征图的所有通道及空间区域的贡献度排序;S3,根据步骤S2得到特征通道集以及特征点集,进而得到基于通道权重因子和类激活映射图的二元掩模图M(1)和M(2);S4,生成基于伯努利分布的随机种子二元图M(3),与M(1)和M(2)进行逻辑运算得到最终的二元掩模图M,并由此获得正则化掩模图Ml;S5,多次迭代式地进行S1-S4的训练过程,完成正则化的优化过程。
-
-
-
-
-
-
-
-
-