-
公开(公告)号:CN109919025A
公开(公告)日:2019-06-21
申请号:CN201910089785.7
申请日:2019-01-30
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度学习的视频场景文本检测方法、系统、设备及介质,所述方法包括:获取静态自然场景文本图像数据;对静态自然场景文本图像数据进行预处理,得到预处理场景文本图像数据;构建基于回归的端到端深度卷积神经网络模型;使用预处理场景文本图像数据对深度卷积神经网络模型进行优化训练;利用训练后的深度卷积神经网络模型进行视频场景文本检测。本发明采用计算机视觉中基于深度学习的检测方法,通过设计高效的基于回归的端到端深度卷积神经网络模型,可以快速并且实时准确地获取视频中的场景文本,能够为后续文字识别等任务提供基础,对视频语义理解、字幕翻译、治安监控安防、无人机飞行、自动驾驶等场景有着重要的应用。
-
公开(公告)号:CN109886155A
公开(公告)日:2019-06-14
申请号:CN201910089817.3
申请日:2019-01-30
Applicant: 华南理工大学
Abstract: 本发明公开了一种基于深度学习的单株水稻检测定位方法、系统、设备及介质,所述方法包括:获取大田水稻样本图像数据;对大田水稻样本图像数据进行预处理和标注,得到预处理图像数据;建立深度卷积神经网络检测模型;使用预处理图像数据对深度卷积神经网络检测模型进行优化训练;利用训练后的深度卷积神经网络检测模型对大田水稻待测图像的单株水稻进行检测定位。本发明采用计算机视觉中基于深度学习的检测方法,可以大大改善上述现有技术的缺陷,通过设计深度卷积神经网络模型,提取植株高维度空间语义特征,在复杂的环境下依然有很好的定位精度和鲁棒性,能够广泛应用于农业的自动化、智能化生产管理中。
-
公开(公告)号:CN105528763B
公开(公告)日:2019-01-29
申请号:CN201510869819.6
申请日:2015-11-30
Applicant: 华南理工大学
Abstract: 本发明提供一种基于多重网格近似算法的自适应区域感知蒙板生成方法,利用多重网格近似算法求解高维度线性系统,并针对人脸美化进行算法优化改进。设置与分辨率相关的优化方法选择开关,选择共轭梯度下降法或稀疏矩阵求解;根据输入图像和导向特征图使用同一张图像的实际情况,将降采样矩阵直接运用于输入图像和导向特征图上,再求得线性系统的近似粗略化矩阵参数,这样显著简化粗略化过程。本发明提出的区域感知蒙板生成技术的处理效率较优化前提升4倍,应用于人脸美化处理能满足系统实时性要求。
-
公开(公告)号:CN105528763A
公开(公告)日:2016-04-27
申请号:CN201510869819.6
申请日:2015-11-30
Applicant: 华南理工大学
CPC classification number: G06T5/002 , G06K9/00234 , G06T2207/20004
Abstract: 本发明提供一种基于多重网格近似算法的自适应区域感知蒙板生成方法,利用多重网格近似算法求解高维度线性系统,并针对人脸美化进行算法优化改进。设置与分辨率相关的优化方法选择开关,选择共轭梯度下降法或稀疏矩阵求解;根据输入图像和导向特征图使用同一张图像的实际情况,将降采样矩阵直接运用于输入图像和导向特征图上,再求得线性系统的近似粗略化矩阵参数,这样显著简化粗略化过程。本发明提出的区域感知蒙板生成技术的处理效率较优化前提升4倍,应用于人脸美化处理能满足系统实时性要求。
-
公开(公告)号:CN105512692A
公开(公告)日:2016-04-20
申请号:CN201510860618.X
申请日:2015-11-30
Applicant: 华南理工大学
CPC classification number: G06K9/6821 , G06K9/6878 , G06K2209/01 , G06N3/084
Abstract: 本发明提供基于BLSTM的联机手写数学公式符号识别方法,对联机手写输入的数学公式,用隐性分割模型对数学公式符号进行处理及识别,然后进行公式分析。本发明基于双向长短时记忆递归神经网络模型设计联机手写数学公式符号识别过程,并使用时域连接模型标注输出的无分割公式序列。对多部件构成的复杂符号,根据ASCII码表转化成单字符标签,减少识别标签的不确定性,统一标签类型。本发明联机手写数学公式符号识别方法识别效果良好,不需对公式进行切分处理,减少了一般公式识别方法中的工作量。多部件复杂符号整体识别的方法有效,比单独识别的准确率有显著提高。
-
公开(公告)号:CN105488472A
公开(公告)日:2016-04-13
申请号:CN201510860633.4
申请日:2015-11-30
Applicant: 华南理工大学
CPC classification number: G06K9/00281 , G06T3/4076 , G06T5/50
Abstract: 本发明提供一种基于样本模板的数字化妆方法,先对淡妆或素颜人脸照片和妆容提供照片进行人脸检测、人脸特征点定位检测和人脸图像变形对准,在此基础上对人脸图像利用改进的引导滤波器进行图层分解,利用基于样本的超分辨率重构算法解决妆容提供图像和输入人脸图像的分辨率差异问题,最后进行人脸图像的图层合成,输出淡妆或素颜照片化妆之后的图像。本发明提出一种新颖的基于模板的数字化妆方法,通过对图层分解和图层合成算法的改进,获得更为真实的化妆效果,且显著缩减算法时间复杂度,使得数字化妆算法实用化和实时化。
-
公开(公告)号:CN119581023A
公开(公告)日:2025-03-07
申请号:CN202411690497.4
申请日:2024-11-25
Applicant: 华南理工大学
IPC: G16H50/30 , A61B5/0205 , A61B5/024 , A61B5/08 , A61B5/091 , G06F18/211 , G06F18/241 , G06F18/10 , G06V40/16 , G06V10/56 , G06V10/25
Abstract: 本发明公开了一种呼吸训练量化评估方法,该方法通过人体生理数据数据采集平台采集人体心率、呼吸、脑机能相关生理参数特征,对特征进行降维、无量纲化处理、加权求和获得呼吸训练量化评估结果。具体步骤如下:首先通过生理参数采集平台采集人体心率、呼吸、脑机能相关生理特征,然后通过随机森林与交叉验证计算各维度特征分类权重并去除冗余特征维度,然后通过无量纲化方法去除特征子集中特征的量纲,最后通过特征权重对特征数据进行加权求和,获得呼吸训练量化评估结果。通过对呼吸训练做出量化评估可以帮助人们制定更科学的呼吸训练策略与方法。
-
公开(公告)号:CN118093956B
公开(公告)日:2024-12-13
申请号:CN202311732230.2
申请日:2023-12-16
Applicant: 华南理工大学
IPC: G06F16/9032 , G06F16/901 , G06F16/28 , G06F16/2455 , G06F16/2458 , G06F16/903 , G06F40/279 , G06F40/216 , G06N3/0442 , G06N5/02 , G06N5/04
Abstract: 本发明公开了一种用于多粒度时序知识图谱的问答方法,包括以下步骤:步骤1,对数据集进行预处理得到实体、关系、事件实体和时间;步骤2,利用数据集训练实体抽取模型和关系抽取模型得到更精准的实体和关系;步骤3,利用得到的实体、关系、事件实体和时间进行图谱查询得到最终的候选答案集;本发明中用于多粒度时序知识图谱的问答方法适应动态环境下的多粒度时序知识图谱问答场景,在多粒度时间和多时序约束下具有高精度问答性能,且该方法保证了推理效率,具有良好的泛化性,对不同类型的问题均有良好的性能。
-
公开(公告)号:CN118314583A
公开(公告)日:2024-07-09
申请号:CN202410337361.9
申请日:2024-03-23
Applicant: 华南理工大学
IPC: G06V30/19 , G06V30/244 , G06V30/18 , G06V10/82
Abstract: 本发明公开了一种语义增强的零样本甲骨文字符识别方法,包括:根据域和字符类别为甲骨文图像构造可学习的提示信息;引入对比式语言‑图像预训练模型,并通过平衡采样策略采样数据,对可学习的提示信息进行优化,以实现从甲骨文拓片和字模图像中挖掘出语义信息;去除域提示信息来得到域无关的提示信息,进而通过语义编码器编码得到域无关的字符语义;通过类内共享特征学习分支和类间差异特征学习分支对视觉编码器进行监督训练;采用训练好的视觉编码器,实现零样本甲骨文字符识别。
-
公开(公告)号:CN117576699A
公开(公告)日:2024-02-20
申请号:CN202311462227.3
申请日:2023-11-06
Applicant: 华南理工大学 , 株洲中车时代电气股份有限公司
IPC: G06V30/148 , G06N3/0464 , G06V10/24 , G06V10/82 , G06V30/19
Abstract: 本发明公开了一种基于深度学习的机车工单信息智能识别方法及系统,包括以下步骤:步骤1,获得机车工单图像数据;步骤2,对机车工单图像数据进行图像预处理得到预处理后的图像数据;步骤3,利用预处理后的图像数据进行文本检测和文本识别;步骤4,利用机车工单图像数据以及文本检测和文本识别的结果进行表格无模板重建,获得机车工单图像的文本信息及文本之间的联系;提升了对机车工单信息智能识别的识别精度,实现了机车工单复杂表格的无模板重建;特别在机车工单多类别的识别场景,都能满足机车维修等后勤工作对机车工单识别的高精度性能需求,能够高效识别出各种机车工单的文本信息和通过表格构建的文本之间的联系。
-
-
-
-
-
-
-
-
-