-
公开(公告)号:CN113205095A
公开(公告)日:2021-08-03
申请号:CN202110392490.4
申请日:2021-04-13
申请人: 北京三快在线科技有限公司 , 华中科技大学
摘要: 本说明书公开了一种训练模型以及字符检测的方法及装置。基于合成训练样本对标注模型进行训练,根据训练后的标注模型的输出对真实训练样本进行标注,并根据合成训练样本对字符检测模型进行训练。通过训练后的字符检测模型对待检测的图像进行特征提取,并确定该图像中各字符的包围框以及该图像中的各中心线。以及根据各中心线与各包围框的重叠程度、与同一中心线重叠的各包围框,确定包围框组,并根据各包围框组中各包围框的几何位置特征,对各中心线向周围进行膨胀得到各膨胀包围框,作为该图像的字符检测结果。可通过训练得到的字符检测模型输出准确的包围框以及中心线,以确定出准确的膨胀包围框,作为字符检测结果。
-
公开(公告)号:CN111898484A
公开(公告)日:2020-11-06
申请号:CN202010675753.8
申请日:2020-07-14
申请人: 华中科技大学 , 北京三快在线科技有限公司
摘要: 本公开涉及一种生成模型的方法、装置、可读存储介质及电子设备。方法包括:获取初始模型的至少一个目标初始网络层各自的初始参数矩阵和压缩比例;针对每一目标初始网络层,根据目标初始网络层的初始参数矩阵和压缩比例,对目标初始网络层进行压缩,以得到样本模型;获取样本数据集;根据样本数据集,对样本模型进行训练,以得到应用在样本数据集所属场景下的目标模型。如此,可以利用取值范围为大于0小于1的压缩比例对目标初始网络层进行压缩,使得压缩后的目标样本网络层中的参数数量小于初始网络层中的参数数量,进而减少了由目标样本网络层构成的样本模型的参数数量,使得目标模型的体积较小,有效地改善了目标模型的性能。
-
公开(公告)号:CN113011424A
公开(公告)日:2021-06-22
申请号:CN202110230635.0
申请日:2021-03-02
申请人: 北京三快在线科技有限公司 , 华中科技大学
摘要: 本说明书公开了一种训练样本的生成方法及生成装置,获取待标注图像以及待标注图像对应的文本标注信息,并将待标注图像输入到预设的识别模型中,得到针对待标注图像中包含的文本行的整体识别结果,作为第一识别结果,以及针对待标注图像中包含的至少部分单个文字的单字识别结果,作为第二识别结果。而后,根据第一识别结果以及第二识别结果,确定针对待标注图像除文本标注信息外的其他标注信息,作为补充标注信息,根据补充标注信息,对文本标注信息进行补充,得到补充后标注信息,并通过补充后标注信息生成待标注图像对应的训练样本,以通过训练样本对识别模型进行训练,从而有效率地产生训练样本。
-
公开(公告)号:CN113011428A
公开(公告)日:2021-06-22
申请号:CN202110289276.6
申请日:2021-03-18
申请人: 北京三快在线科技有限公司 , 华中科技大学
摘要: 本说明书公开了一种模型训练的方法以及装置,获取各待标注图像,针对每个待标注图像,将该待标注图像输入到待训练的文字行识别模型中,得到文字行识别结果,以及将该待标注图像输入到预设的单字识别模型中,得到单字识别结果。而后,根据单字识别结果,对文字行识别结果进行校正,得到校正后文字行识别结果。最后,根据校正后文字行识别结果,对该待标注图像进行标注,得到标注后图像,通过标注后图像,对待训练的文字行识别模型进行模型训练。本方法将单字识别结果和文字行识别结果进行结合,可以有效的提高数据标注的准确性,从而使得文字行识别模型的准确率提高。
-
公开(公告)号:CN118918577A
公开(公告)日:2024-11-08
申请号:CN202410935345.X
申请日:2024-07-12
申请人: 华中科技大学
摘要: 本发明涉及一种三维目标检测方法、装置及系统。其方法部分主要包括:将初始三维体素特征按照基于窗口的三维体素划分方式进行划分,得到第一阶段的三维体素特征;将第一阶段的三维体素特征通过三维描述子进行局部的特征提取,得到第二阶段的三维体素特征;将第二阶段的三维体素特征通过扩散和合并来进行特征生成,得到第三阶段的三维体素特征;将第三阶段的三维体素特征经过基于窗口划分和线性分组循环神经网络的骨干网络进行特征提取,得到第四阶段的三维体素特征;将第四阶段的三维体素特征通过鸟瞰图骨干网络和检测头进行处理,得到最终的检测结果。本发明在三维目标检测任务中表现出更优异的性能,为该领域提供了新的理论和技术支持。
-
公开(公告)号:CN118072327A
公开(公告)日:2024-05-24
申请号:CN202311742665.5
申请日:2023-12-15
申请人: 华中科技大学
IPC分类号: G06V30/19 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06V10/82 , G06N3/0985
摘要: 本发明公开了一种基于多尺度信息的联机签名快速检索方法,其方法包括:首先使用合成数据对训练数据集进行扩充;其次在签名时间序列进行数据预处理和数据增强,提取有利于身份辨别的时间函数;然后采用基于多尺度融合的神经网络提取和对齐签名特征,将这些特征映射到共同的空间之中,使用三元组损失对模型进行优化;利用已登记签名建立特征向量库,在验证新签名身份时,使用近似最近邻搜索方法快速搜索并验证其身份。本发明为大规模签名认证数据库的快速检索问题提供了一种有效解决方案。本发明还提供了相应的基于多尺度信息的联机签名快速检索装置。
-
公开(公告)号:CN114742799B
公开(公告)日:2024-04-26
申请号:CN202210401019.1
申请日:2022-04-18
申请人: 华中科技大学
IPC分类号: G06T7/00 , G06V10/26 , G06V10/774 , G06V10/80 , G06V10/82 , G06N3/0464 , G06N3/096
摘要: 本发明公开一种基于自监督异构网络的工业场景未知类型缺陷分割方法:准备大型预训练网络并固定参数,作为教师网络;构建异构学生网络,由异构特征编码模块、特征融合模块和分割模块组成;训练异构学生网络,将合成异常图像输入至教师和异构学生网络中,一方面,约束学生网络在合成图像的正常区域提取的多尺度特征与教师网络相应尺度特征相似,另一方面,约束分割模块产生的分割概率图准确回归合成的异常区域;测试阶段通过教师和异构学生网络提取的相应尺度的特征图的差异和分割概率图得到异常得分图,设置合适的阈值二值化得到异常分割图。本发明通过对特征编码模块的相关设计和自监督的引入,实现了对图像异常区域的精确分割。
-
公开(公告)号:CN117315686A
公开(公告)日:2023-12-29
申请号:CN202311287573.2
申请日:2023-10-07
申请人: 华中科技大学
摘要: 本发明公开了一种基于分类模型的甲骨文辅助破译分类方法,该方法包括:获取数据源,并基于所述数据源进行数据集的划分;训练分类模型,其中包括:将训练集输入训练模型中训练,在训练过程中,对训练集每一组图像中不同时期汉字图像进行特征系数加权;每轮训练结束后,输出由验证集得到的模型性能评估参数,根据这些参数的优劣筛选得到的分类模型;所有训练结束后,将测试集中的图片去除标签作为未破译甲骨文置于所述分类模型中进行预测,输出预测正确率高于预设数值的结果;基于分类模型,进行未破译甲骨文的分类和辅助破译。本方法方便地实现了甲骨文辅助破译的分类范式。本发明还提供了相应的基于分类模型的甲骨文辅助破译分类系统。
-
公开(公告)号:CN117115804A
公开(公告)日:2023-11-24
申请号:CN202311078304.5
申请日:2023-08-23
申请人: 华中科技大学
IPC分类号: G06V20/64 , G06V20/70 , G06V10/25 , G06V10/764 , G06V10/774 , G06V10/766 , G06V10/82 , G06N3/0455 , G06N3/0895
摘要: 本发明涉及一种基于视觉Transformer的弱‑半监督三维点云目标检测方法:获取数据集的物体级标注数据,并在标注框内选取伪标注点;训练一个点到框的转换器,将点云场景和所选取的伪标注点编码为tokens,使用一个视觉Transformer的编码器将场景tokens和标注tokens进行交互,训练并优化生成伪标注框的质量;获取点级别标注数据,使用上一步骤训练的视觉Transformer推理并得到伪标注框数据;在物体级标注和由点级标注生成的伪标注框上训练已有的室外或室内三维点云目标检测方法;利用训练好的模型进行三维目标检测。本发明通过减少数据集的标注量,只标注少量物体级标注和剩余点级别标注,得到与100%全标注数据相近的性能。本发明还提供相应的基于视觉Transformer的弱‑半监督三维点云目标检测装置。
-
公开(公告)号:CN110837835B
公开(公告)日:2022-11-08
申请号:CN201911038568.1
申请日:2019-10-29
申请人: 华中科技大学
IPC分类号: G06V30/148 , G06V10/44 , G06V30/18 , G06V10/774 , G06V30/19 , G06V10/764
摘要: 本发明公开了一种基于边界点检测的场景文本端到端识别方法,通过特征金字塔网络提取文本特征,用于区域提取网络生成候选文本框;然后通过多方向矩形检测网络检测文本实例的更为精准的多方向包围盒;其次在多方向包围盒内检测文本的上下两条边界点序列;最后利用检测到的边界点序列将任意形状的文本转化为水平文本供后续的基于注意力机制的序列识别网络进行识别,最后利用集束搜索算法找到给定词典中预测序列的最匹配单词得到最终的文本识别结果。该方法可以在不需要字符级别的标注情况下同时检测和识别自然图像中任意形状的场景文本,包括水平文本、多方向文本和曲形文本,并且可以完全地进行端到端训练。
-
-
-
-
-
-
-
-
-