-
公开(公告)号:CN117876798A
公开(公告)日:2024-04-12
申请号:CN202410268717.8
申请日:2024-03-11
申请人: 华南理工大学
IPC分类号: G06V10/764 , G06N3/0464 , G06N3/08 , G06T7/00 , G06V10/44 , G06V10/766 , G06V10/82
摘要: 本发明提供了一种发动机打刻面缺陷检测方法、系统、设备及存储介质,所述方法包括:采集用于发动机打刻面缺陷检测的数据集;通过Faster‑Rcnn网络对数据集中图像进行特征提取,得到特征图;将特征图通过解耦合模块进行解耦处理,得到分类特征和回归特征;将分类特征进行卷积操作,得到分类得分;根据回归特征,得到质量得分和预测框边界预测值;将分类得分和质量得分进行组合,得到预测质量得分;根据预测质量得分对预测框边界预测值进行检测,得到发动机打刻面缺陷的目标预测框。本发明在faster‑rcnn网络基础上新增了一个分支用于预测预选框的质量得分,使得分类特征和回归特征的解耦程度增加,并在NMS阶段采用新分支得到的质量得分预测目标预测框,提高了检测精度。
-
公开(公告)号:CN114373118B
公开(公告)日:2024-04-05
申请号:CN202111664231.9
申请日:2021-12-30
申请人: 华南理工大学
摘要: 本发明公开了一种基于改进YOLOV4的水下目标检测方法,包括:1)前期数据处理,包括对原始数据集进行Albumentations数据增强和Retinex数据增强,将处理后的数据集通过k‑means聚类算法对数据集中的边界框进行聚类;2)把聚类结果作为改进YOLOV4的边界框大小,将处理后数据集输入到主干网络模块,通过主干网络模块获取目标的特征信息,将提取的特征信息输入到特征提取模块,特征提取模块进行不同尺度的最大池化和融合操作,特征融合后的信息进行卷积运算,得到不同尺度的特征层输出,最终由预测模块对输出的数据进行信息分析和处理,得出检测结果。本发明具有了深度学习技术的特性,通过训练可以不断优化网络,提高检测能力。
-
公开(公告)号:CN113312909B
公开(公告)日:2023-01-06
申请号:CN202110545942.8
申请日:2021-05-19
申请人: 华南理工大学
IPC分类号: G06F40/289 , G06F40/211 , G06N3/04
摘要: 本发明公开了一种基于自然语言处理的智能分析试题答案方法与系统,包括:获取试题的文本数据,包括标准答案和学生答案,并进行形式化的处理;基于词向量的动态表征方法,获取每个句子的向量表示;基于现有的自然语言处理的神经网络模型,利用集成的思想,建立混合神经网络模型;使用混合神经网络模型,对得到的标准答案和学生答案句子的向量表示一一进行分析比对,计算句子的相似性;根据句子的相似性高低进行排序,将学生答案与标准答案进行匹配,根据匹配结果,分析学生答案,给出对应的答题指导。本发明可以帮助学习者了解自己的答题不足,做到因材施教,帮助学习者提高成绩。
-
公开(公告)号:CN107945791B
公开(公告)日:2021-07-20
申请号:CN201711268206.2
申请日:2017-12-05
申请人: 华南理工大学
IPC分类号: G10L15/05 , G10L15/06 , G10L15/26 , G10L19/02 , G10L21/0216
摘要: 本发明公开了一种基于深度学习目标检测的语音识别方法,包括步骤:1)对输入语音进行录制存储;2)将语音转化为语谱图,通过短时傅里叶变换将原始语音转化为时频分析图;3)对语谱图的局部有效区域进行标注;4)将有标注的语谱图作为输入,使用目标检测网络对其进行有监督的训练;5)将检测网络的输出结果对应到相应的文字,作为最终的输出。本发明将语音识别技术与目标检测技术相结合,针对有效的时频交叉区域进行识别,克服了嘈杂环境中高频噪音的影响,改善了现有语音识别技术在噪音环境下的不足。
-
公开(公告)号:CN111292415A
公开(公告)日:2020-06-16
申请号:CN202010114817.7
申请日:2020-02-25
申请人: 华南理工大学
摘要: 本发明公开了一种基于球坐标位置图的单视图三维人脸重建方法,包括步骤:1)输入包含人脸的单视图,检测出图中人脸所在位置;2)根据检测出的位置裁剪出单视图上的人脸图像,转换为固定的大小后进行预处理;3)将预处理后的图像输入到编码器,编码器输出特征图;4)将提取的特征图输入到解码器,解码器输出球坐标表示的位置图;5)将球坐标表示的位置图转换为笛卡尔坐标位置图,根据转换后的位置图重建三维人脸。本发明方法具有计算速度快,内存资源消耗小,方法的泛化性能好,能够精准重建复杂环境下的人脸等优点。
-
公开(公告)号:CN106909216B
公开(公告)日:2020-05-22
申请号:CN201710005939.0
申请日:2017-01-05
申请人: 华南理工大学
摘要: 本发明公开了一种基于Kinect传感器的仿人机械手控制方法,包括步骤:1)通过Kinect传感器采集数据;2)对采集的数据进行预处理,然后使用相关算法进行手势分割;3)使用DBN神经网络进行手势识别;4)将识别的手势转化成固定格式的指令;5)利用TCP协议进行远程通信,将指令发送到服务器端;6)服务器端接收并识别指令,通过运动学计算得到控制参数;7)服务器端根据控制参数控制机械手的运动。本发明方法考虑了实际操作的成本及准确率、响应速度等方面的要求,克服了基于数据手套控制成本高及基于鼠标键盘等传统人机交互方式对专业知识有一定要求的问题,具有操作人性化、响应速度快、准确率高的优点,并且具有很好的鲁棒性。
-
公开(公告)号:CN106127749A
公开(公告)日:2016-11-16
申请号:CN201610444131.8
申请日:2016-06-16
申请人: 华南理工大学
CPC分类号: G06T7/0004 , G06T2207/30164
摘要: 本发明公开了一种基于视觉注意机制的目标零件识别方法,包括:视觉注意机制模型选择,选择基于特征的注意机制模型和基于空间的注意机制模型,利用生物的中央周边滤波器结构,在多个空间尺度上提取颜色、方向、亮度特征;特征组合的显著图生成,将颜色、方向和亮度特征组合成为特征图,从而得到对应的显著性描述,将经过归一化计算及线性组合后形成显著图;目标生产零件识别策略,按照采集零件图像、生成显著图、二值化处理及优化、抽取显著区域、零件区域抽取的流程来进行零件识别。该发明使工业机器人的视觉系统能够有效识别工作空间内的目标零件,准确定位目标零件,使工业机器人在完成生产零件装配作业时具有更高的自主性、鲁棒性、适应性。
-
公开(公告)号:CN104463191A
公开(公告)日:2015-03-25
申请号:CN201410606526.4
申请日:2014-10-30
申请人: 华南理工大学
发明人: 肖南峰
IPC分类号: G06K9/62
CPC分类号: G06K9/6296
摘要: 本发明公布了一种基于注意机制的机器人视觉处理方法,包含以下步骤:图像预处理:对图像进行基本处理,包括颜色空间转换、边缘提取、图像变换和图像阈值化;特征提取:对经过预处理的图像,提取其肤色、颜色、纹理、运动和空间坐标五类特征信息;仲裁决策:对于提取的信息,按照一定的仲裁决策策略,有选择地分发给需要该特征信息上层功能应用子系统;功能应用:经过仲裁决策后递交过来的特征信息,进行相应的操作实现功能应用,即机器人视觉应用的直接实现层,包括人脸检测、颜色识别、运动检测与跟踪、手势交互、注意机制五个部分。本发明的方法,能够提供给机器人更为完备的人脸和肤色及手势等视觉信息,且具有运动检测和跟踪及规划的能力。
-
公开(公告)号:CN1801181A
公开(公告)日:2006-07-12
申请号:CN200610032659.0
申请日:2006-01-06
申请人: 华南理工大学
发明人: 肖南峰
IPC分类号: G06K9/00
摘要: 本发明公开了一种在实际环境中,实时和准确地识别出活动的人脸与车牌号码的机器人;该机器人包括2个用于获取活动的人脸与车牌图像的CMOS彩色摄像机和1块图像处理板以及1台个人计算机、用于追踪活动的人脸与车牌的5自由度双眼立体视觉装置、5个直流伺服电机和1个直流伺服驱动器以及1块数据采集卡、通过与人脸样本图像库比对识别人脸的人脸识别系统、用于识别车牌号码的车牌识别系统,还包括指纹识别装置,声音识别装置。本发明适用于刑事侦察、出入境关口、军事要地的人员与车辆实时监控,政府机关和住宅小区进出口安全检查、停车场所和公路收费站收费管理等领域。
-
公开(公告)号:CN114357129B
公开(公告)日:2023-02-14
申请号:CN202111488261.9
申请日:2021-12-07
申请人: 华南理工大学
IPC分类号: G06F16/332 , G06F16/33 , G06F40/211 , G06F18/22
摘要: 本发明公开了一种高并发多轮聊天机器人系统及其数据处理方法,包括:高并发处理模块,用于解决聊天机器人在线的能处理多请求的需求,其应用了网络IO处理模式,将处理逻辑集中在服务器中,终端进行任务请求,通过网络传输请求和回应;第三方语音识别接口模块,用于解析语音信息;基于自然语言处理的多轮聊天处理模块,用于处理关键逻辑,实现多轮聊天对话。本发明通过将高并发网络技术、语音识别接口和基于自然语言处理的多轮聊天机器人智能模型结合,构建一个高效完整的在线的能处理多请求且支持多轮聊天的机器人系统,进一步提升聊天机器人的适应性和交互性,也体现了一种广泛适用的聊天机器人系统框架。
-
-
-
-
-
-
-
-
-