专利检索 ap:("华中科技大学") AND inv:"张嘉剑" 第 1 页

1.

发明授权
基于在线增强检测的视频文字目标追踪方法与电子设备有权

公开(公告)号：CN111931571B

公开(公告)日：2022-05-17

申请号：CN202010643270.X

申请日：2020-07-07

申请人： 华中科技大学

发明人： 周瑜 , 张嘉剑 , 朱盈盈 , 卞飞飞 , 白翔 , 杨志博 , 王永攀

IPC分类号： G06V20/40 , G06V30/148 , G06V10/774 , G06V10/82 , G06K9/62 , G06F40/30 , G06N3/04

摘要： 本发明公开了一种基于在线增强检测的视频文字目标追踪方法：逐帧输入视频图片；使用文字目标检测与特征提取网络进行文字目标的定位与特征提取，获取文字目标位置和包含语义信息和空间背景信息的特征向量，使特征向量对于不同身份的文字目标有很强的区分度；利用文字位置距离、文字形态距离、文字特征距离进行帧与帧之间文字目标的匹配，通过匈牙利算法获取文字目标匹配结果，匹配成功的文字目标赋予相同的身份；建立在线增强检测机制，使用基于孪生网络的跟踪器对先前帧中未匹配成功的文字目标预测其在当前帧的位置，同时基于此预测结果增强当前视频帧文字目标检测结果；根据视频图片帧中检测到的文字目标身份，确定所有文字目标的运动轨迹。

2.

发明公开
基于在线增强检测的视频文字目标追踪方法与电子设备有权

公开(公告)号：CN111931571A

公开(公告)日：2020-11-13

申请号：CN202010643270.X

申请日：2020-07-07

申请人： 华中科技大学

发明人： 周瑜 , 张嘉剑 , 朱盈盈 , 卞飞飞 , 白翔 , 杨志博 , 王永攀

IPC分类号： G06K9/00 , G06K9/34 , G06K9/62 , G06F40/30 , G06N3/04

摘要： 本发明公开了一种基于在线增强检测的视频文字目标追踪方法：逐帧输入视频图片；使用文字目标检测与特征提取网络进行文字目标的定位与特征提取，获取文字目标位置和包含语义信息和空间背景信息的特征向量，使特征向量对于不同身份的文字目标有很强的区分度；利用文字位置距离、文字形态距离、文字特征距离进行帧与帧之间文字目标的匹配，通过匈牙利算法获取文字目标匹配结果，匹配成功的文字目标赋予相同的身份；建立在线增强检测机制，使用基于孪生网络的跟踪器对先前帧中未匹配成功的文字目标预测其在当前帧的位置，同时基于此预测结果增强当前视频帧文字目标检测结果；根据视频图片帧中检测到的文字目标身份，确定所有文字目标的运动轨迹。