-
公开(公告)号:CN114120445A
公开(公告)日:2022-03-01
申请号:CN202111371379.3
申请日:2021-11-18
Applicant: 北京易达图灵科技有限公司 , 南京南瑞信息通信科技有限公司 , 中国科学院自动化研究所
Abstract: 本发明提供一种动态信息增强的行为识别方法及装置,所述方法包括:确定待识别视频的图像序列;将图像序列输入至行为识别模型,得到行为识别模型输出的行为识别结果,行为识别模型是基于样本视频的样本图像序列和样本行为识别结果训练得到的;其中,行为识别模型用于对图像序列中各帧图像进行特征提取,得到表观特征图序列,对表观特征图序列中每相邻两个表观特征图进行差分运算,得到动态特征图序列,对动态特征图序列和表观特征图序列进行特征编码,得到动态特征表示,并基于动态特征表示进行行为识别。本发明提供的方法、装置、电子设备与存储介质,在提升行为识别的准确率的同时,也提高了行为识别的实时性,应用价值更高。
-
公开(公告)号:CN113642415B
公开(公告)日:2024-06-04
申请号:CN202110813933.2
申请日:2021-07-19
Applicant: 南京南瑞信息通信科技有限公司 , 北京易达图灵科技有限公司 , 中国科学院自动化研究所
Abstract: 本发明提供一种人脸特征表达方法及人脸识别方法,引入了深层结构特征图,并将深层结构特征图中各节点表征的局部特征与全局特征向量相结合,可以使对待表达人脸图像的特征表达更加全面准确,为将特征表达应用于人脸识别时得到的识别结果提供显式的依据和理由,使识别结果的可解释性、可信度大为提升。
-
公开(公告)号:CN114038052A
公开(公告)日:2022-02-11
申请号:CN202111121648.0
申请日:2021-09-24
Applicant: 南京南瑞信息通信科技有限公司 , 北京易达图灵科技有限公司 , 中国科学院自动化研究所
Abstract: 本发明提供一种行人重识别方法及系统,该方法包括:确定待识别行人图像;将待识别行人图像输入至特征提取模型,得到特征提取模型输出的全局特征向量和局部特征向量;对全局特征向量和局部特征向量进行拼接融合,得到所述待识别行人图像对应的完整特征表达;并基于完整特征表达,将待识别行人图像与预设图像库中的行人图像进行匹配,确定待识别行人图像的行人重识别结果;其中,局部特征向量包括特征提取模型确定的特征图在垂直方向及深度方向上的多个局部特征向量。该方法进行了全局特征向量和局部特征向量等多维特征的提取,并利用待识别行人图像的宏观全局特征与微观局部特征进行行人重识别,把控整体与细节,提高了行人重识别的准确率。
-
公开(公告)号:CN113762120A
公开(公告)日:2021-12-07
申请号:CN202110998312.6
申请日:2021-08-27
Applicant: 南京南瑞信息通信科技有限公司 , 北京易达图灵科技有限公司 , 中国科学院自动化研究所
Abstract: 本发明提供一种绝缘子图像分割方法、装置、电子设备及存储介质,其中方法包括:获取包含绝缘子的待分割图像;将所述待分割图像输入至绝缘子图像分割模型,得到所述绝缘子图像分割模型输出的所述待分割图像的绝缘子分割结果;其中,所述绝缘子图像分割模型是基于绝缘子图像分割评估模型的生成器确定的;所述绝缘子图像分割评估模型是基于条件生成对抗网络构建的;所述生成器是基于Unet神经网络构建的。本发明提供的方法、装置、电子设备及存储介质,提高了绝缘子图像分割的精度,提高了绝缘子图像分割的效率。
-
公开(公告)号:CN113705322A
公开(公告)日:2021-11-26
申请号:CN202110655846.9
申请日:2021-06-11
Applicant: 北京易达图灵科技有限公司 , 南京南瑞信息通信科技有限公司 , 中国科学院自动化研究所
Abstract: 本发明提供一种基于门限图神经网络的手写汉字识别方法和装置,其中方法包括:确定待识别汉字的汉字节点矩阵以及空间信息关系矩阵;所述汉字节点矩阵中的各汉字节点为所述待识别汉字的书写视频中每一时刻书写位置的坐标;将所述汉字节点矩阵和所述空间信息关系矩阵输入至汉字识别模型中,得到所述汉字识别模型输出的识别结果;其中,所述汉字识别模型用于基于门限图神经网络,提取所述汉字节点矩阵对应的包含图结构信息的汉字特征向量,提取所述汉字特征向量中的时序信息,得到时序特征向量,并基于所述时序特征向量经由瓶颈网络进行手写汉字识别。本发明综合了汉字的空间结构信息和时序信息,提高了手写汉字识别的准确性。
-
公开(公告)号:CN113705322B
公开(公告)日:2024-05-24
申请号:CN202110655846.9
申请日:2021-06-11
Applicant: 北京易达图灵科技有限公司 , 南京南瑞信息通信科技有限公司 , 中国科学院自动化研究所
IPC: G06V30/32 , G06V10/82 , G06N3/0442 , G06N3/042 , G06N3/08
Abstract: 本发明提供一种基于门限图神经网络的手写汉字识别方法和装置,其中方法包括:确定待识别汉字的汉字节点矩阵以及空间信息关系矩阵;所述汉字节点矩阵中的各汉字节点为所述待识别汉字的书写视频中每一时刻书写位置的坐标;将所述汉字节点矩阵和所述空间信息关系矩阵输入至汉字识别模型中,得到所述汉字识别模型输出的识别结果;其中,所述汉字识别模型用于基于门限图神经网络,提取所述汉字节点矩阵对应的包含图结构信息的汉字特征向量,提取所述汉字特征向量中的时序信息,得到时序特征向量,并基于所述时序特征向量经由瓶颈网络进行手写汉字识别。本发明综合了汉字的空间结构信息和时序信息,提高了手写汉字识别的准确性。
-
公开(公告)号:CN113642415A
公开(公告)日:2021-11-12
申请号:CN202110813933.2
申请日:2021-07-19
Applicant: 南京南瑞信息通信科技有限公司 , 北京易达图灵科技有限公司 , 中国科学院自动化研究所
Abstract: 本发明提供一种人脸特征表达方法及人脸识别方法,引入了深层结构特征图,并将深层结构特征图中各节点表征的局部特征与全局特征向量相结合,可以使对待表达人脸图像的特征表达更加全面准确,为将特征表达应用于人脸识别时得到的识别结果提供显式的依据和理由,使识别结果的可解释性、可信度大为提升。
-
公开(公告)号:CN110059617A
公开(公告)日:2019-07-26
申请号:CN201910308713.7
申请日:2019-04-17
Applicant: 北京易达图灵科技有限公司
Abstract: 本发明实施例提供一种目标物体的识别方法及装置。其中,方法包括:将待识别图片输入至第一神经网络模型,输出所述待识别图片中每一目标物体对应的位置框坐标;将所述位置框坐标输入至云台摄像机,获取所述云台摄像机拍摄到的对应目标物体的图片,并基于所述图片对所述目标物体进行识别。本发明实施例提供的方法及装置,通过将待识别图片输入至第一神经网络模型,根据该模型的输出结果控制云台摄像机拍摄到放大的且更加清晰的包含目标物体的图片,基于该图片进行目标物体的识别,可提高识别的准确率,并且,通过神经网络获取输出结果的过程较快,因此整体降低了识别过程所耗费的时长。
-
公开(公告)号:CN109977884A
公开(公告)日:2019-07-05
申请号:CN201910247797.8
申请日:2019-03-29
Applicant: 北京易达图灵科技有限公司
Abstract: 本发明实施例提供一种目标跟随方法和装置,其中方法包括:基于跟随设备上装设的视觉传感装置获取当前图像;将当前图像输入至目标跟随模型,获取目标跟随模型输出的当前动作指令;其中,目标跟随模型是基于样本图像、样本动作指令和样本标识训练得到的;基于当前动作指令控制跟随设备进行目标跟随。本发明实施例提供的方法和装置,计算资源消耗较小,简单方便,无需额外配备加速设备,即可实现当前动作指令的实时输出,提高了跟随设备的安全性和实时性,避免了由于延时导致跟丢跟随目标的问题。此外,在模型训练过程中,无需人工标注跟随目标,仅需通过样本标识评价目标跟随和避障结果,降低了人力成本和时间成本损耗,提高了模型训练效率。
-
公开(公告)号:CN108427953A
公开(公告)日:2018-08-21
申请号:CN201810162541.2
申请日:2018-02-26
Applicant: 北京易达图灵科技有限公司
Abstract: 本发明实施例提供一种文字识别方法及装置。所述方法包括:获取待识别图片,所述待识别图片上包括待识别的文字信息;将所述待识别图片作为目标神经网络模型的输入,通过预先创建的所述目标神经网络模型对所述待识别图片进行文字识别,以得到所述待识别图片中的所述文字信息。所述装置用于执行所述方法。本发明实施例通过将待识别图片输入到目标神经网络模型中,目标神经网络模型对待识别图片进行文字识别,得到待识别图片中的文字信息,提高了文字识别的效率及准确性。
-
-
-
-
-
-
-
-
-