-
公开(公告)号:CN110598698A
公开(公告)日:2019-12-20
申请号:CN201910800835.8
申请日:2019-08-29
申请人: 华中科技大学
IPC分类号: G06K9/32
摘要: 本发明公开了一种基于自适应区域建议网络的自然场景文本检测方法和系统,属于图像处理技术领域,包括:对自然场景文本数据集进行标注,得到训练集;构建包含特征提取网络、自适应区域建议网络、目标分类与角点回归网络的网络模型;利用训练集训练网络模型时,利用特征提取网络提取训练集的多尺度特征,利用自适应区域建议网络预测各尺度特征下的文本目标中心和文本目标矩形框宽高,利用目标分类与角点回归网络预测文本目标类别和各尺度特征下的文本目标矩形框的角点坐标,进而得到训练好的网络模型。将待检测自然场景图像输入训练好的网络模型,得到自然场景文本目标框。本发明克服锚点框机制缺陷、检测方法性能佳、文本的召回率高。
-
公开(公告)号:CN110232133B
公开(公告)日:2022-09-20
申请号:CN201910416355.1
申请日:2019-05-16
申请人: 华中科技大学
IPC分类号: G06F16/583 , G06F16/55 , G06F16/53
摘要: 本发明公开了一种基于特征融合和款式分类的服装图像检索方法和系统,属于图像处理技术领域,包括:在待查询服装图像中提取全局特征和局部特征后进行特征融合,得到待查询服装图像的特征描述子,利用概率预测网络预测待查询服装图像属于查询库中各个款式类别的概率;对于概率较大的前N个款式类别,计算待查询服装图像的特征描述子与查询库中该N个款式类别对应的服装图像的特征描述子之间的相似度值,将相似度值较大的前K个查询库中服装图像作为检索结果。本发明的特征描述子对服装的柔性形变、拍摄角度和摆放姿势等变化具有较强的鲁棒性,从而能提高服装检索的性能;同时,款式分类任务能够进行预筛选,进而获得更高的检索效率。
-
公开(公告)号:CN110598698B
公开(公告)日:2022-02-15
申请号:CN201910800835.8
申请日:2019-08-29
申请人: 华中科技大学
IPC分类号: G06V20/62
摘要: 本发明公开了一种基于自适应区域建议网络的自然场景文本检测方法和系统,属于图像处理技术领域,包括:对自然场景文本数据集进行标注,得到训练集;构建包含特征提取网络、自适应区域建议网络、目标分类与角点回归网络的网络模型;利用训练集训练网络模型时,利用特征提取网络提取训练集的多尺度特征,利用自适应区域建议网络预测各尺度特征下的文本目标中心和文本目标矩形框宽高,利用目标分类与角点回归网络预测文本目标类别和各尺度特征下的文本目标矩形框的角点坐标,进而得到训练好的网络模型。将待检测自然场景图像输入训练好的网络模型,得到自然场景文本目标框。本发明克服锚点框机制缺陷、检测方法性能佳、文本的召回率高。
-
公开(公告)号:CN110580462B
公开(公告)日:2022-02-15
申请号:CN201910811411.1
申请日:2019-08-29
申请人: 华中科技大学
IPC分类号: G06V20/62 , G06V30/146 , G06V30/18 , G06V30/19 , G06V30/148 , G06V10/46 , G06K9/62
摘要: 本发明公开了一种基于非局部网络的自然场景文本检测方法和系统,属于图像处理技术领域,方法包括:提取图片的多尺度特征,并使用非局部网络重构各个尺度特征,得到重构后的特征;利用重构后的特征产生文本的候选区域;根据候选区域提取感兴趣区域,并通过分类和回归网络对感兴趣区域进行文本和非文本的分类以及位置和尺寸的调整,最终得到图像中的文本目标。本发明通过使用非局部网络重构各个尺度特征,能够有效地抑制文本检测结果中伪正样本的发生,由此解决现有技术存在将背景区域误判为文本目标的技术问题。
-
公开(公告)号:CN110580462A
公开(公告)日:2019-12-17
申请号:CN201910811411.1
申请日:2019-08-29
申请人: 华中科技大学
摘要: 本发明公开了一种基于非局部网络的自然场景文本检测方法和系统,属于图像处理技术领域,方法包括:提取图片的多尺度特征,并使用非局部网络重构各个尺度特征,得到重构后的特征;利用重构后的特征产生文本的候选区域;根据候选区域提取感兴趣区域,并通过分类和回归网络对感兴趣区域进行文本和非文本的分类以及位置和尺寸的调整,最终得到图像中的文本目标。本发明通过使用非局部网络重构各个尺度特征,能够有效地抑制文本检测结果中伪正样本的发生,由此解决现有技术存在将背景区域误判为文本目标的技术问题。
-
公开(公告)号:CN110232133A
公开(公告)日:2019-09-13
申请号:CN201910416355.1
申请日:2019-05-16
申请人: 华中科技大学
IPC分类号: G06F16/583 , G06F16/55 , G06F16/53
摘要: 本发明公开了一种基于特征融合和款式分类的服装图像检索方法和系统,属于图像处理技术领域,包括:在待查询服装图像中提取全局特征和局部特征后进行特征融合,得到待查询服装图像的特征描述子,利用概率预测网络预测待查询服装图像属于查询库中各个款式类别的概率;对于概率较大的前N个款式类别,计算待查询服装图像的特征描述子与查询库中该N个款式类别对应的服装图像的特征描述子之间的相似度值,将相似度值较大的前K个查询库中服装图像作为检索结果。本发明的特征描述子对服装的柔性形变、拍摄角度和摆放姿势等变化具有较强的鲁棒性,从而能提高服装检索的性能;同时,款式分类任务能够进行预筛选,进而获得更高的检索效率。
-
公开(公告)号:CN110222685A
公开(公告)日:2019-09-10
申请号:CN201910411194.7
申请日:2019-05-16
申请人: 华中科技大学
摘要: 本发明公开了一种基于两阶段的服装关键点定位方法和系统,属于图像处理技术领域,方法包括:采用基于多任务的深度神经网络对服装图像中的服装关键点进行定位,得到服装关键点的粗定位信息;根据服装关键点的粗定位信息,提取感兴趣服装区域;采用深度全卷积网络对感兴趣服装区域中的服装关键点进行定位,得到服装关键点的最终定位信息;所述基于多任务的深度神经网络通过同时训练服装关键点的坐标回归任务、服装关键点的结构类型预测任务和服装关键点可视化类型预测任务后得到。本发明方法能够解决现有的基于单阶段的定位方法定位精度不高的问题,并更好地适应服装遮挡、形变,姿势变化等情况。
-
-
-
-
-
-