基于多媒体语义解析的监控视频智能预警方法

发明公开

请登陆查看更多内容

专利标题： 基于多媒体语义解析的监控视频智能预警方法
申请号： CN202110447507.1

申请日： 2021-04-25
公开(公告)号： CN113111837A

公开(公告)日： 2021-07-13
发明人: 胡宇鹏 , 贾永坡 , 高赞 , 宋雪萌 , 尹建华 , 李毅仁 , 聂礼强
申请人： 山东省人工智能研究院 , 山东大学 , 河钢数字技术股份有限公司 , 河钢集团有限公司
申请人地址： 山东省济南市历下区科院路19号; ; ;
专利权人： 山东省人工智能研究院,山东大学,河钢数字技术股份有限公司,河钢集团有限公司
当前专利权人： 山东省人工智能研究院,山东大学,河钢数字技术股份有限公司,河钢集团有限公司
当前专利权人地址： 山东省济南市历下区科院路19号; ; ;
代理机构： 济南泉城专利商标事务所
代理商 支文彬
主分类号： G06K9/00
IPC分类号： G06K9/00 ; G06K9/62 ; G06N3/04 ; G06N3/08

摘要：

一种基于多媒体语义解析的监控视频智能预警方法，通过建立跨模态语义对齐模型对视频中所包含的复杂对象与交互进行准确理解，并生成视频片段时空位置图和视频语义树，另一方面，引入基于双向长短时记忆网络的文本编码模块，对查询语句中的文本语义进行深刻理解与表征。实现多模态特征向共空间的特征映射与融合，并利用语义剪枝策略，粗粒度筛选出精炼的“视频片段‑查询语句”对，进行细粒度语义匹配计算，从而确保跨模态视频定位的精度与效率。

公开/授权文献

CN113111837B 基于多媒体语义解析的监控视频智能预警方法公开/授权日：2022-05-13

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06K	图形数据读取（图像或视频识别或理解G06V）；数据的呈现；记录载体；处理记录载体
G06K9/00	识别模式的方法或装置（图形读取或将机械参数模式（例如力或存在）转换为电信号的方法或装置 G06K11/00）（图像或视频识别或理解 G06V）（语音识别 G10L15/00 )