-
公开(公告)号:CN109544536A
公开(公告)日:2019-03-29
申请号:CN201811421818.5
申请日:2018-11-26
Applicant: 中国科学技术大学
IPC: G06T7/00
Abstract: 本发明公开了一种髋关节X光图像快速自动分析方法,包括:获取预先进行了关键点位置标注的髋关节X光图像;对于预先收集的一系列髋关节X光图像,根据标注的关键点位置制作深度学习数据集,其中包含了训练集与测试集;构建了一个基于2D神经网络的回归系统,回归系统根据输入的髋关节X光图像预测各个关键点的坐标值,利用训练集对回归系统进行训练,并利用测试集对于训练后的回归系统进行测试;对于待分析的髋关节X光图像,将其输入至通过测试的回归系统,得到各个关键点的坐标值。该方法可以快速的、准确的实现髋关节X光图像自动分析。
-
公开(公告)号:CN117909535B
公开(公告)日:2024-05-31
申请号:CN202410301227.3
申请日:2024-03-15
Applicant: 中国科学技术大学
IPC: G06F16/583 , G06F40/126 , G06F40/194 , G06F40/30 , G06T9/00
Abstract: 本发明公开了一种基于视觉语言模型的组合理解方法、系统、设备与介质,它们是一一对应的方案,方案中:利用纯视觉大模型与纯语言大模型强大的表示能力提升细粒度视觉编码器和多样化文本编码器表示的细粒度与多样性,显著提升了细节特征的挖掘能力与鲁棒性,随后引入基于采样的去噪项改进对比损失,有效抑制假性负例噪声,同时引入模态内与模态间对比损失,增强模态内一致性与模态间的对齐,有效抑制噪声,提升了表示向量的鲁棒性,因此,可以,显著提升了视觉语言模型的组合理解能力,在多个组合理解数据集上达到了先进水平。
-
公开(公告)号:CN116452896A
公开(公告)日:2023-07-18
申请号:CN202310715333.1
申请日:2023-06-16
Applicant: 中国科学技术大学
IPC: G06V10/764 , G06V10/44 , G06V10/422 , G06V10/54 , G06V10/77 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/0475 , G06N3/047 , G06N3/048 , G06N3/08
Abstract: 本发明公开了一种用于提升细粒度图像分类性能的方法、系统、设备及介质,它们是一一对应的方案,方案中:在细粒度图像分类网络中设置源信息生成器、中间处理器与目标结合器对细粒度图像分类网络提取的图像特征进行处理后再进行分类,可以提升分类精确度;源信息生成器、中间处理器与目标结合器可以适用于多种结构的细粒度图像分类网络,体现了其即插即用特性,并且,所需的额外计算非常小,与现有的细粒度图像分类网络相结合,能带来更进一步的性能提升,体现了泛用性;综上所示,本发明可以兼顾计算资源消耗和精度提升,并且可以实现即插即用性和泛用性,对于细粒度识别的实际应用有积极深远的影响。
-
公开(公告)号:CN110689091A
公开(公告)日:2020-01-14
申请号:CN201910993791.5
申请日:2019-10-18
Applicant: 中国科学技术大学
IPC: G06K9/62
Abstract: 本发明公开了一种弱监督细粒度物体分类方法,包括:对于待分类图像,通过区域建议网络生成一系列矩形的局部区域,并将各个局部区域按照置信度从大到小的顺序进行排序,选出M个局部区域;通过特征提取器提取M个局部区域的特征向量,从而预测M个局部区域为每一类别的概率值;预测结果将用于后续的集成预测部分,以及区域建议网络与集成预测中分类器的优化;通过特征提取器提取待分类图像的特征向量,从而预测待分类图像为每一类别的概率值;结合M个局部区域中前K个局部区域为每一类别的概率值以及待分类图像为每一类别的概率值,计算每一类别的最终概率值,选出最大概率值的类别作为分类结果。该方法具有分类精确度高、成本较低的优点。
-
公开(公告)号:CN118585818A
公开(公告)日:2024-09-03
申请号:CN202410755618.2
申请日:2024-06-12
Applicant: 中国科学技术大学
IPC: G06F18/214 , G06F18/2135 , G06N3/045 , G06N3/096 , G06F40/30 , G06F40/186
Abstract: 本发明公开了一种基于细粒度图文语义对齐的鲁棒性增强训练方法与系统,它们是相对应的方案,方案中:针对假阴性和语义丧失两大问题,分别提出去噪对比损失和基于参数合并策略的规则约束管道,前者通过分布分解的策略,以减少假阴性的消极影响,后者设计了更严格的构造规则以消除部分可控的语义丧失样本,基于上述两种针对性策略的帮助下,缓解了低质量负样本的消极影响,避免了捷径学习,从而获得了更加鲁棒的对齐效果。同时,针对低密度描述问题,本发明提出了致密化蒸馏策略,更为直接地引导模型生成高密度的表征。本发明赋予了文本编码器更强的理解能力,同时也进一步增强了图文表征的全局性,因此,提升视觉语言模型的组合理解能力。
-
公开(公告)号:CN118551828A
公开(公告)日:2024-08-27
申请号:CN202410839661.7
申请日:2024-06-26
Applicant: 中国科学技术大学
IPC: G06N3/094 , G06N3/084 , G06N3/0464 , G06N3/0475 , G06N5/04 , G06F40/30 , G06F16/35 , G06N3/048
Abstract: 本公开提供了一种生成文本检测模型的训练方法、文本检测方法,涉及人工智能技术领域,该生成文本检测模型的训练方法包括:获取训练样本集,训练样本集包括多个样本对,样本对包括人工问答文本和机器问答文本,机器问答文本是利用目标大模型基于人工问答文本中包括的问题而生成的;分别对多个样本对进行词编码,得到多个词向量序列;利用多个词向量序列,对与初始模型对应的权重矩阵进行参数调节,得到目标权重矩阵;基于初始模型和目标权重矩阵,得到与目标大模型对应的生成文本检测模型。
-
公开(公告)号:CN110120266B
公开(公告)日:2022-09-30
申请号:CN201910568724.9
申请日:2019-06-27
Applicant: 中国科学技术大学
Abstract: 本发明公开了一种骨骼年龄评估方法,包括:基于注意力机制,从原始掌骨影像X的特征图上挖掘多个感兴趣骨骼区域;基于识别机制,从多个感兴趣骨骼区域中识别出符合要求若干感兴趣骨骼区域,并将识别出的若干感兴趣骨骼区域的特征图与原始掌骨影像X的特征图拼接,得到特征向量C;最终,将识别出的每一感兴趣骨骼区域的特征图、原始掌骨影像X的特征图、以及特征向量C分别经过全连接层后,进行骨龄预测,并将所有预测结果集成,得到骨骼年龄评估结果。该方法具有较高准确性,且评估速度较快。
-
公开(公告)号:CN112006654B
公开(公告)日:2021-07-13
申请号:CN202010685114.X
申请日:2020-07-16
Applicant: 中国科学技术大学 , 安徽省儿童医院(安徽省新华医院、安徽省儿科医学研究所)
Abstract: 本发明公开了一种基于卷积神经网络和多重注意力机制的骨骼年龄评估方法,包括:训练阶段,主干网络输入为掌骨影像,通过特征提取器获得特征图F,进而得到骨龄回归值;多重注意力模块输入为特征图F,经通过压缩操作与注意力图拆分操作得到M个子注意力图,每个子注意力图再与特征图F点乘,进而得到对应的骨龄回归值;结合主干网络与多重注意力模块得到的骨龄回归值,采用多任务学习策略训练神经网络;测试阶段,将待测掌骨影像输入至训练后的神经网络中,通过其中主干网络得到骨龄评估值。上述模型可被端到端训练;同时能自动生成注意力分布图,具有更好的泛化性;此外,基于2D卷积神经网络,速度快,精度高,平均评估误差在4.1个月内。
-
公开(公告)号:CN117972141B
公开(公告)日:2024-06-18
申请号:CN202410375523.8
申请日:2024-03-29
Applicant: 中国科学技术大学
IPC: G06F16/78 , G06F16/75 , G06F16/783 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/08 , G06N5/04
Abstract: 本发明公开了一种基于纯文本数据训练的图像理解方法、系统、设备及介质,它们是一一对应的方案,方案中:利用纯文本数据进行训练,极大的节省了复杂的图文数据收集和标注流程,并且通过实验表明,采用本发明训练后的图像理解模型具有较高的理解精确度;而且,相比于传统方案在训练和推理阶段使用复杂的文本编码器,本发明在推理阶段仅输入图像,无需额外的文本编码器,从而大大加速了推理速度,对实际应用有积极深远的影响。
-
公开(公告)号:CN117972141A
公开(公告)日:2024-05-03
申请号:CN202410375523.8
申请日:2024-03-29
Applicant: 中国科学技术大学
IPC: G06F16/78 , G06F16/75 , G06F16/783 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/08 , G06N5/04
Abstract: 本发明公开了一种基于纯文本数据训练的图像理解方法、系统、设备及介质,它们是一一对应的方案,方案中:利用纯文本数据进行训练,极大的节省了复杂的图文数据收集和标注流程,并且通过实验表明,采用本发明训练后的图像理解模型具有较高的理解精确度;而且,相比于传统方案在训练和推理阶段使用复杂的文本编码器,本发明在推理阶段仅输入图像,无需额外的文本编码器,从而大大加速了推理速度,对实际应用有积极深远的影响。
-
-
-
-
-
-
-
-
-