一种改进的目标检测方法、系统及装置

    公开(公告)号:CN109741333A

    公开(公告)日:2019-05-10

    申请号:CN201811652762.4

    申请日:2018-12-28

    IPC分类号: G06T7/10 G06T3/40 G06K9/46

    摘要: 本发明公开了一种改进的目标检测方法、系统及装置,其中方法包括以下步骤:获取待检测的原图片,并按照第一预设方式对原图片进行划分后,获得n张区域图片;依次对各区域图片进行分层提取后,获得n组第一局部图片;将第一局部图片的尺寸放大至原图片的尺寸后,获得n组第二局部图片;采用预设的检测模型对第二局部图片进行目标检测后,根据检测结果分别从各组第二局部图片中获取一张第二局部图片;将n张第二局部图片按照第二预设方式融合成一张检测图片,并将检测图片的尺寸缩小至原图片的尺寸后,输出检测图片。本发明有效地减少了目标检测算法对小目标漏检和错检的概率,极大地提高了检测的精确度,可广泛应用于检测技术领域。

    一种无人机监控场景下的人体行为识别方法、系统及装置

    公开(公告)号:CN108182416A

    公开(公告)日:2018-06-19

    申请号:CN201711488387.X

    申请日:2017-12-30

    IPC分类号: G06K9/00 H04N5/272 H04N7/18

    摘要: 本发明公开了一种无人机监控场景下的人体行为识别方法、系统及装置,方法包括:通过无人机监控摄像头对所需的监控地点进行视频拍摄并预处理,得到样本视频;基于样本视频,对样本视频中人体行为进行分类,并创建卷积神经网络模型和训练测试集样本库,进而通过训练测试集样本库对卷积神经网络模型进行训练;将实际监控视频进行处理后输入至训练后的卷积神经网络模型中,得到实际监控视频中的人体行为的分类类型。本发明通过训练后的卷积神经网络模型能够实时自动对现实无人机平台监控场景下人体的各类行为进行识别,网络泛化能力较好,有效提升识别效果。本发明可广泛应用于行为识别领域中。

    一种基于嵌入式多路高清录播设备的导播控制方法及系统

    公开(公告)号:CN106547632A

    公开(公告)日:2017-03-29

    申请号:CN201610884825.3

    申请日:2016-10-09

    IPC分类号: G06F9/54 H04N5/222

    摘要: 本发明公开了一种基于嵌入式多路高清录播设备的导播控制方法及系统,该导播控制方法包括以下步骤:S1、建立多路高清录播设备对应的QT导播控制方案;S2、QT进程往共享内存写入数据从而生成待传递的消息;S3、QT进程发送消息到消息队列中;S4、视频处理进程循环读取消息队列,获取QT进程发送的消息;S5、视频处理进程响应于所获取的消息,执行相应的指令;其中,消息包括写入共享内存的数据的偏移位置以及数据长度。本发明可以克服网络对录播设备设置的延时影响,而且可以全方位导播控制,操作方便,可广泛应用于视频导播行业中。

    一种基于计算机视觉的视频切片方法、系统、设备及介质

    公开(公告)号:CN114363720A

    公开(公告)日:2022-04-15

    申请号:CN202111492456.0

    申请日:2021-12-08

    摘要: 本发明公开了一种基于计算机视觉的视频切片方法、系统、设备及介质,方法包括:本发明实施例对待切片视频进行解码并输出视频帧图片;对所述视频帧图片进行手部关键点提取处理,确定手部关键点时间序列流;通过滑动窗口对所述手部关键点时间序列流进行手部动作匹配,确定手部行为信息;对所述视频帧图片进行目标检测,确定节点三元组;根据所述手部行为信息对所述节点距离进行位置检测,确定行为三元组;根据所述行为三元组中的动作起止时间戳对所述待切片视频进行剪辑,确定视频切片;能够通过手部与物体的交互行为确定切片的起止时间戳,实现自动化视频切片,提高了视频切片的效率,可广泛应用于视频切片技术领域。

    一种教师教课行为识别方法、系统、装置和存储介质

    公开(公告)号:CN109800662A

    公开(公告)日:2019-05-24

    申请号:CN201811617861.9

    申请日:2018-12-28

    摘要: 本发明公开了一种教师教课行为识别方法、系统、装置和存储介质,所述方法包括对从教师教课过程视频流中获取到的待识别图像进行运动目标检测,提取出运动目标,生成与所述运动目标相应的运动历史图,计算与所述运动历史图相应的运动特征,将所述运动特征输入到经过训练的卷积神经网络中,接收卷积神经网络输出的教师教课行为分类结果作为识别结果等步骤。本发明通过使用经过训练的卷积神经网络对从待识别图像提取出的运动特征进行分类,可以达到良好的识别效果,具有噪声小、时间复杂度小、识别精度高等优势。通过识别视频中的教师教课行为,可以对教师的教课质量进行客观评价。本发明广泛应用于图像识别技术领域。

    一种基于集中协调学习的人脸识别方法、系统及装置

    公开(公告)号:CN109784219A

    公开(公告)日:2019-05-21

    申请号:CN201811623909.7

    申请日:2018-12-28

    摘要: 本发明公开了一种基于集中协调学习的人脸识别方法、系统及装置,其中,方法包括以下步骤:获取待识别的人脸图片,并对人脸图片进行人脸检测后,获得第一人脸图像;对第一人脸图像进行对齐处理后,获取预设尺寸的第二人脸图像;将第二人脸图像输入预设的基于集中协调学习的人脸识别模型进行特征提取后,获得第二人脸图像的人脸特征向量;结合人脸特征向量与预设的人脸数据库计算余弦相似度,并根据余弦相似度获取人脸识别结果。本发明采用基于集中协调学习的人脸识别模型对人脸图像进行特征提取,将各特征拉到原点并分别到全部象限中,类间距离更大,提高了人脸的分类效率和识别准确度,可广泛应用于人脸识别技术领域。

    一种基于计算机视觉的视频切片方法、系统、设备及介质

    公开(公告)号:CN114363720B

    公开(公告)日:2024-03-12

    申请号:CN202111492456.0

    申请日:2021-12-08

    摘要: 本发明公开了一种基于计算机视觉的视频切片方法、系统、设备及介质,方法包括:本发明实施例对待切片视频进行解码并输出视频帧图片;对所述视频帧图片进行手部关键点提取处理,确定手部关键点时间序列流;通过滑动窗口对所述手部关键点时间序列流进行手部动作匹配,确定手部行为信息;对所述视频帧图片进行目标检测,确定节点三元组;根据所述手部行为信息对所述节点距离进行位置检测,确定行为三元组;根据所述行为三元组中的动作起止时间戳对所述待切片视频进行剪辑,确定视频切片;能够通过手部与物体的交互行为确定切片的起止时间戳,实现自动化视频切片,提高了视频切片的效率,可广泛应用于视频切片技术领域。

    一种实验设备状态检测方法及系统

    公开(公告)号:CN115775341B

    公开(公告)日:2023-05-09

    申请号:CN202310106750.6

    申请日:2023-02-13

    IPC分类号: G06V10/764

    摘要: 本发明公开了一种实验设备状态检测方法及系统,其中方法如下:获取记录实验设备状态的图像集,将图像集中的一张图像入目标检测函数识别出图像中所有目标实验设备;将每个目标实验设备输入对应的一个图像分类函数,输出目标实验设备对应的状态分类置信度值;判断目标实验设备的状态分类置信度值是否大于阈值T;若目标实验设备的状态分类置信度值大于阈值,直接输出目标实验设备的状态分类置信度值;若目标实验设备的状态分类置信度值小于或等于阈值T,将目标实验设备的状态分类置信度值与相关矩阵相乘,并遍历相乘后的所有元素,将最大值的元素作为最终状态输出。本发明通过互相验证实验设备之间彼此的状态,以提升状态检测的精度。

    一种基于嵌入式多路高清录播设备的导播控制方法及系统

    公开(公告)号:CN106547632B

    公开(公告)日:2019-12-10

    申请号:CN201610884825.3

    申请日:2016-10-09

    IPC分类号: G06F9/54 H04N5/222

    摘要: 本发明公开了一种基于嵌入式多路高清录播设备的导播控制方法及系统,该导播控制方法包括以下步骤:S1、建立多路高清录播设备对应的QT导播控制方案;S2、QT进程往共享内存写入数据从而生成待传递的消息;S3、QT进程发送消息到消息队列中;S4、视频处理进程循环读取消息队列,获取QT进程发送的消息;S5、视频处理进程响应于所获取的消息,执行相应的指令;其中,消息包括写入共享内存的数据的偏移位置以及数据长度。本发明可以克服网络对录播设备设置的延时影响,而且可以全方位导播控制,操作方便,可广泛应用于视频导播行业中。

    一种基于分段双流模型的行为识别方法、系统及装置

    公开(公告)号:CN108280406A

    公开(公告)日:2018-07-13

    申请号:CN201711488438.9

    申请日:2017-12-30

    摘要: 本发明公开了一种基于分段双流模型的行为识别方法、系统及装置,方法包括:采用H.265/HEVC的视频压缩标准录制监控视频;对样本数据集进行样本扩容,得到扩容样本数据集;创建组合卷积神经网络模型,进而通过扩容样本数据集对组合卷积神经网络模型进行训练,得到训练后的组合卷积神经网络模型;将实际监控视频进行处理后输入至训练后的组合卷积神经网络模型中,得到实际监控视频中的人体行为的识别结果。本发明通过利用分段双流CNNs和LSTMs组合的组合卷积神经网络模型识别人体行为类别,通过充分提取视频数据中有效特征,能有效实时分析视频中学生行为,且能大大提高识别准确率。本发明可广泛应用于行为识别领域中。