-
-
-
公开(公告)号:CN118898255A
公开(公告)日:2024-11-05
申请号:CN202411388055.4
申请日:2024-10-08
申请人: 山东大学 , 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) , 浙江大华技术股份有限公司 , 山东师范大学
IPC分类号: G06F40/30 , G06F40/284 , G06F40/226 , G06N3/042 , G06N3/0464 , G06N3/08 , G06V20/40 , G06V10/80
摘要: 本发明属于多模态联合建模的对话意图处理技术领域。提供了一种基于视觉文本联合建模的共指消解、词义消歧方法及系统,基于文本增强特征和视频增强特征,使用跨注意力特征网络进行特征调整,得到调整后特征,使用分布相似度度量对调整后特征进行协调,对协调后的特征进行共指消解预测,得到输入文本对应的共指消解结果;本发明通过跨模态注意力机制,将文本特征和视觉特征融合,生成准确的联合表示,捕捉文本与视频内容之间的深层语义关系,从而构建了高效的词义消歧模型,克服了现有方法面对用户复杂多变的自然语言查询语句时消歧表现不佳的问题。
-
公开(公告)号:CN118570503B
公开(公告)日:2024-10-25
申请号:CN202411034778.4
申请日:2024-07-30
申请人: 浙江大华技术股份有限公司
IPC分类号: G06V10/74 , G06V10/776 , G06V10/774 , G06V10/764 , G06V40/16
摘要: 本发明公开了一种图像识别方法、装置及系统。其中方法包括:通过特征提取网络提取待识别图像的图像特征,所述特征提取网络是通过无标签数据集和有标签数据集训练得到的,所述无标签数据集与所述有标签数据集对应不同的数据类别;基于所述图像特征与图像底库进行比对,确定第一相似度值最高的前m个图像,其中m为正整数;基于所述图像特征与所述无标签数据集进行比对,确定所述m个图像分别对应的第二相似度值;根据所述第一相似度值与所述第二相似度值,从所述m个图像中确定所述待识别图像对应的目标图像。采用上述方法,可以有效降低干扰,提高图像识别的准确性。
-
公开(公告)号:CN118827972A
公开(公告)日:2024-10-22
申请号:CN202410761634.2
申请日:2020-11-24
申请人: 浙江大华技术股份有限公司
IPC分类号: H04N19/103 , H04N19/50 , H04N19/105
摘要: 本申请公开基于串编码技术的编码方法、设备及存储介质。其中,基于串编码技术的编码方法包括:根据矢量残差句法元素判断矢量残差是否为零矢量;若矢量残差为零矢量,即最佳运动信息与预测运动信息相同,利用预测运动信息在预测运动矢量候选列表中的索引,对像素串的运动信息进行编码;若矢量残差不为零矢量,即最佳运动信息与预测运动信息不同,利用预测运动信息在预测运动矢量候选列表中的索引和矢量残差,对像素串的运动信息进行编码。通过采用一个矢量残差句法元素来代表矢量残差,在最佳运动信息SV与预测运动信息相同时,无需再同时编码最佳预测运动信息的index和矢量残差SVD,有效减少编码比特数,提高视频编码压缩率。
-
公开(公告)号:CN111914670B
公开(公告)日:2024-10-15
申请号:CN202010650659.7
申请日:2020-07-08
申请人: 浙江大华技术股份有限公司
摘要: 本申请公开了一种遗留物品检测方法、装置、系统及存储介质,用以避免因为天气、光照变化对遗留物品误检。本申请实施例提供的一种遗留物品检测方法,包括:进行背景模型建立;获取检测图像中的运动区域,在运动区域提取第一特征点;获取检测图像的前一帧图像,并在前一帧图像中与运动区域重合的区域中提取第二特征点;将第一特征点和第二特征点进行匹配,确定第一特征点和第二特征点中匹配特征点的数量;判断匹配特征点的数量与第一特征点或第二特征点的数量比是否小于第一预设值;当匹配特征点的数量与第一特征点或第二特征点的数量比小于第一预设值时,将运动区域作为第一可疑区域,并判断第一可疑区域中是否包括遗留物品。
-
公开(公告)号:CN118692155A
公开(公告)日:2024-09-24
申请号:CN202411173753.2
申请日:2024-08-26
申请人: 浙江大华技术股份有限公司
IPC分类号: G06V40/40 , G06V10/764 , G06V10/44 , G06V10/82 , G06V10/42 , G06V10/80 , G06N3/0455
摘要: 本发明实施例提供了一种图像检测的方法及装置,包括:将待检测图像输入至目标神经网络模型,通过目标神经网络模型的第一编码器对待检测图像进行特征提取,得到目标局部特征;通过目标神经网络模型的第二编码器对待检测图形进行特征提取,得到目标全局特征;通过目标神经网络模型的检测头对目标全局特征进行边框识别,得到待检测图像的边框特征;对目标局部特征和目标全局特征进行融合,得到目标融合特征;将边框特征、目标融合特征输入目标神经网络模型的分类器得到目标神经网络模型的输出结果,其中,输出结果用于表示待检测图像是否为活体图像。通过本发明,解决了相关技术中活体识别准确率低的问题,进而达到了提高活体识别准确率的效果。
-
公开(公告)号:CN112001963B
公开(公告)日:2024-09-24
申请号:CN202010761984.0
申请日:2020-07-31
申请人: 浙江大华技术股份有限公司
IPC分类号: G06T7/62 , G06T3/06 , G06V10/764
摘要: 本发明公开了消防通道的排查的方法、系统和计算机设备,其中,获取消防通道双目图像的三维点云和该消防通道的地面面积;将该三维点云进行地面投影,获取二维平面的点云分布;在该二维平面上获取该双目图像上物品的外接图形面积;根据外接图形面积与该地面面积的比值,确定该消防通道是否堵塞,解决了消防安全督查的排查效率和排查质量无法得到保障的问题,提高了消防安全督查的排查效率和排查质量。
-
公开(公告)号:CN115018704B
公开(公告)日:2024-09-20
申请号:CN202210591631.X
申请日:2022-05-27
申请人: 浙江大华技术股份有限公司
IPC分类号: G06F17/16 , G06V10/74 , G06V10/764 , G06T7/13
摘要: 本申请涉及图像处理技术领域,尤其涉及一种图像处理方法、装置、电子设备和存储介质,用以高效准确的进行图像裁剪。其中,方法包括:对初始图像中的目标对象进行标注,获得目标对象的对象边界信息;基于对象边界信息以及预设的背景裁剪比例值,确定图像裁剪范围;基于图像裁剪范围和预设的对象占比值,获得至少两个目标裁剪边界信息;基于获得的至少两个目标裁剪边界信息对初始图像进行裁剪,获得初始图像的至少两个初始子图像。由于本申请通过基于预设的背景裁剪比例值和对象占比值,确定目标裁剪边界信息,并基于目标裁剪边界信息对初始图像进行裁剪,能够高效准确的进行图像裁剪,获得的裁剪后的图像用于模型训练,能够提高模型预测的准确率。
-
公开(公告)号:CN112052300B
公开(公告)日:2024-08-30
申请号:CN202010778658.0
申请日:2020-08-05
申请人: 浙江大华技术股份有限公司
IPC分类号: G06F16/29
摘要: 本申请公开了一种SLAM后端处理方法、装置和计算机可读存储介质,该方法包括:接收待处理地图数据与响应数据,其中,待处理地图数据包括点云数据以及点云数据对应的位姿序列,响应数据包括多条线段的信息;基于多条线段的信息与位于多条线段附近的第一点云数据,调整多条线段的位置,得到位于调整后的多条线段附近的第二点云数据以及相应的第一位姿序列;对第一位姿序列进行调整,得到第二位姿序列;对第二位姿序列进行处理,得到第三位姿序列,以使得第三位姿序列连续;基于第三位姿序列与接收到的预设约束进行联合优化,得到新的地图数据。通过上述方式,本申请能够提高SLAM建图一致性。
-
-
-
-
-
-
-
-
-