-
公开(公告)号:CN118314583B
公开(公告)日:2025-01-21
申请号:CN202410337361.9
申请日:2024-03-23
Applicant: 华南理工大学
IPC: G06V30/19 , G06V30/244 , G06V30/18 , G06V10/82
Abstract: 本发明公开了一种语义增强的零样本甲骨文字符识别方法,包括:根据域和字符类别为甲骨文图像构造可学习的提示信息;引入对比式语言‑图像预训练模型,并通过平衡采样策略采样数据,对可学习的提示信息进行优化,以实现从甲骨文拓片和字模图像中挖掘出语义信息;去除域提示信息来得到域无关的提示信息,进而通过语义编码器编码得到域无关的字符语义;通过类内共享特征学习分支和类间差异特征学习分支对视觉编码器进行监督训练;采用训练好的视觉编码器,实现零样本甲骨文字符识别。
-
公开(公告)号:CN113807336B
公开(公告)日:2023-06-30
申请号:CN202110906651.7
申请日:2021-08-09
Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)
Abstract: 本发明公开了一种图像文本检测半自动标注方法、系统、计算机设备及介质,所述方法包括:获取文本图像;从文本图像中获取文本中心线;生成N个围绕文本中心线的候选边界框;将N个候选文本区域同时输入宽松识别器和严苛识别器,通过宽松识别器将从N个候选文本区域中识别得到估计的文本内容,通过严苛识别器预测每个候选文本区域的内容识别结果;将N个内容识别结果与估计的文本内容相比,分别计算识别损失,得到N个识别损失;通过确定所有识别损失中最小损失的索引,获得最准确候选边界框的索引,进而得到最终的文本框标注;将文本框标注以识别损失为引导进行优化,最终得到紧致的文本框标注。本发明能够提高文本检测标注效率和标注效果。
-
公开(公告)号:CN113807336A
公开(公告)日:2021-12-17
申请号:CN202110906651.7
申请日:2021-08-09
Applicant: 华南理工大学 , 人工智能与数字经济广东省实验室(广州)
IPC: G06K9/20
Abstract: 本发明公开了一种图像文本检测半自动标注方法、系统、计算机设备及介质,所述方法包括:获取文本图像;从文本图像中获取文本中心线;生成N个围绕文本中心线的候选边界框;将N个候选文本区域同时输入宽松识别器和严苛识别器,通过宽松识别器将从N个候选文本区域中识别得到估计的文本内容,通过严苛识别器预测每个候选文本区域的内容识别结果;将N个内容识别结果与估计的文本内容相比,分别计算识别损失,得到N个识别损失;通过确定所有识别损失中最小损失的索引,获得最准确候选边界框的索引,进而得到最终的文本框标注;将文本框标注以识别损失为引导进行优化,最终得到紧致的文本框标注。本发明能够提高文本检测标注效率和标注效果。
-
公开(公告)号:CN115620322B
公开(公告)日:2023-04-07
申请号:CN202211637591.4
申请日:2022-12-20
Applicant: 华南理工大学
IPC: G06V30/412 , G06F40/151 , G06T7/66 , G06T7/70 , G06V10/28 , G06V10/32 , G06V10/34 , G06V10/44 , G06V10/764
Abstract: 本发明公开了一种基于关键点检测的全线表表格结构识别方法,包括:采用关键点检测网络对表格图像中的关键点进行检测,得到包含所有关键点位置信息的高斯热图;将高斯热图放缩至和输入表格图像尺寸一致,并通过轮廓中心距算法得到所有关键点的坐标位置;使用扫描线法解析关键点在表格中的结构位置关系;使用连通域法检测相邻的关键点是否存在连接关系;根据关键点之间的结构位置关系和连接关系重构出表格中所有的单元格,并转换为需要的标记语言描述。本发明方法采用基于深度学习的关键点检测方法能够鲁棒地找到表格图像中的所有表格线交点,并根据这些关键点获取所有单元格的准确位置,从而高质量完成表格结构识别。
-
公开(公告)号:CN115620322A
公开(公告)日:2023-01-17
申请号:CN202211637591.4
申请日:2022-12-20
Applicant: 华南理工大学
IPC: G06V30/412 , G06F40/151 , G06T7/66 , G06T7/70 , G06V10/28 , G06V10/32 , G06V10/34 , G06V10/44 , G06V10/764
Abstract: 本发明公开了一种基于关键点检测的全线表表格结构识别方法,包括:采用关键点检测网络对表格图像中的关键点进行检测,得到包含所有关键点位置信息的高斯热图;将高斯热图放缩至和输入表格图像尺寸一致,并通过轮廓中心距算法得到所有关键点的坐标位置;使用扫描线法解析关键点在表格中的结构位置关系;使用连通域法检测相邻的关键点是否存在连接关系;根据关键点之间的结构位置关系和连接关系重构出表格中所有的单元格,并转换为需要的标记语言描述。本发明方法采用基于深度学习的关键点检测方法能够鲁棒地找到表格图像中的所有表格线交点,并根据这些关键点获取所有单元格的准确位置,从而高质量完成表格结构识别。
-
公开(公告)号:CN113856132B
公开(公告)日:2022-04-22
申请号:CN202111137670.4
申请日:2021-09-27
Applicant: 华南理工大学
Abstract: 本发明公开了一种跳绳动作识别系统、方法及跳绳,其中系统包括:三轴加速度计,安装在跳绳手柄上,用于采集人体运动数据;压力传感器阵列,安装在跳绳手柄上,用于采集握持状态数据;数据处理模块,用于采用预设的跳绳动作识别模型对所述人体运动数据进行处理,识别获得跳绳的动作类别;以及采用预设的握持状态识别模型对所述握持状态数据进行处理,识别获得握持方法类别。本发明通过三轴加速度计采集人体运动数据,压力传感器阵列采集握持状态数据,根据采集到的数据识别用户的跳绳动作以及握持方法,帮助用户建立科学锻炼计划,规范跳绳动作。本发明可广泛应用于智能健身运动设备技术领域。
-
公开(公告)号:CN113856132A
公开(公告)日:2021-12-31
申请号:CN202111137670.4
申请日:2021-09-27
Applicant: 华南理工大学
Abstract: 本发明公开了一种跳绳动作识别系统、方法及跳绳,其中系统包括:三轴加速度计,安装在跳绳手柄上,用于采集人体运动数据;压力传感器阵列,安装在跳绳手柄上,用于采集握持状态数据;数据处理模块,用于采用预设的跳绳动作识别模型对所述人体运动数据进行处理,识别获得跳绳的动作类别;以及采用预设的握持状态识别模型对所述握持状态数据进行处理,识别获得握持方法类别。本发明通过三轴加速度计采集人体运动数据,压力传感器阵列采集握持状态数据,根据采集到的数据识别用户的跳绳动作以及握持方法,帮助用户建立科学锻炼计划,规范跳绳动作。本发明可广泛应用于智能健身运动设备技术领域。
-
公开(公告)号:CN118314583A
公开(公告)日:2024-07-09
申请号:CN202410337361.9
申请日:2024-03-23
Applicant: 华南理工大学
IPC: G06V30/19 , G06V30/244 , G06V30/18 , G06V10/82
Abstract: 本发明公开了一种语义增强的零样本甲骨文字符识别方法,包括:根据域和字符类别为甲骨文图像构造可学习的提示信息;引入对比式语言‑图像预训练模型,并通过平衡采样策略采样数据,对可学习的提示信息进行优化,以实现从甲骨文拓片和字模图像中挖掘出语义信息;去除域提示信息来得到域无关的提示信息,进而通过语义编码器编码得到域无关的字符语义;通过类内共享特征学习分支和类间差异特征学习分支对视觉编码器进行监督训练;采用训练好的视觉编码器,实现零样本甲骨文字符识别。
-
公开(公告)号:CN111025981A
公开(公告)日:2020-04-17
申请号:CN201911320456.5
申请日:2019-12-19
Applicant: 华南理工大学
IPC: G05B19/042
Abstract: 本发明公开了一种基于单片机的物联网掌上电子相册,包括按键部分、显示部分、复位部分、存储部分、无线部分、单片机以及电源;所述按键部分、显示部分、复位部分、存储部分、无线部分均与单片机连接,作为单片机的外设,各部分以及单片机均与电源连接。该发明可以替代传统的纸质相册,成本低廉,传输方便,同时还可扩容,本发明是采用了无线传输技术实现了物联功能,可以利用WiFi方便地从手机或电脑把图片下载到相册,实现在电子相册上显示手机的图片文件,顺应了电子设备无线化的潮流,为生活带来极大的便利。
-
-
-
-
-
-
-
-