-
公开(公告)号:CN111931571B
公开(公告)日:2022-05-17
申请号:CN202010643270.X
申请日:2020-07-07
申请人: 华中科技大学
IPC分类号: G06V20/40 , G06V30/148 , G06V10/774 , G06V10/82 , G06K9/62 , G06F40/30 , G06N3/04
摘要: 本发明公开了一种基于在线增强检测的视频文字目标追踪方法:逐帧输入视频图片;使用文字目标检测与特征提取网络进行文字目标的定位与特征提取,获取文字目标位置和包含语义信息和空间背景信息的特征向量,使特征向量对于不同身份的文字目标有很强的区分度;利用文字位置距离、文字形态距离、文字特征距离进行帧与帧之间文字目标的匹配,通过匈牙利算法获取文字目标匹配结果,匹配成功的文字目标赋予相同的身份;建立在线增强检测机制,使用基于孪生网络的跟踪器对先前帧中未匹配成功的文字目标预测其在当前帧的位置,同时基于此预测结果增强当前视频帧文字目标检测结果;根据视频图片帧中检测到的文字目标身份,确定所有文字目标的运动轨迹。
-
公开(公告)号:CN111931571A
公开(公告)日:2020-11-13
申请号:CN202010643270.X
申请日:2020-07-07
申请人: 华中科技大学
摘要: 本发明公开了一种基于在线增强检测的视频文字目标追踪方法:逐帧输入视频图片;使用文字目标检测与特征提取网络进行文字目标的定位与特征提取,获取文字目标位置和包含语义信息和空间背景信息的特征向量,使特征向量对于不同身份的文字目标有很强的区分度;利用文字位置距离、文字形态距离、文字特征距离进行帧与帧之间文字目标的匹配,通过匈牙利算法获取文字目标匹配结果,匹配成功的文字目标赋予相同的身份;建立在线增强检测机制,使用基于孪生网络的跟踪器对先前帧中未匹配成功的文字目标预测其在当前帧的位置,同时基于此预测结果增强当前视频帧文字目标检测结果;根据视频图片帧中检测到的文字目标身份,确定所有文字目标的运动轨迹。
-