发明授权
- 专利标题: 基于视频的图文网页生成方法及装置
-
申请号: CN202311475166.4申请日: 2023-11-08
-
公开(公告)号: CN117194818B公开(公告)日: 2024-01-16
- 发明人: 刘成书 , 唐海霞 , 王涛 , 韩博 , 刘真 , 高凌辉 , 李文永 , 卫世杰 , 孙思遥 , 高树奎 , 张小师 , 刘亚伟
- 申请人: 北京信立方科技发展股份有限公司
- 申请人地址: 北京市西城区新街口外大街28号B座416室(德胜园区)
- 专利权人: 北京信立方科技发展股份有限公司
- 当前专利权人: 北京信立方科技发展股份有限公司
- 当前专利权人地址: 北京市西城区新街口外大街28号B座416室(德胜园区)
- 代理机构: 北京路浩知识产权代理有限公司
- 代理商 耿琦
- 主分类号: G06F16/9538
- IPC分类号: G06F16/9538 ; G06V20/62 ; G06V30/19 ; G06V30/26 ; G06F16/33 ; G06F16/738 ; G06F16/783
摘要:
本发明提供一种基于视频的图文网页生成方法及装置,涉及互联网技术领域,方法包括:获取包括至少一组视频帧组的视频帧序列,以及获取各视频帧组对应的语音数据;对各语音数据进行语音识别;对各视频帧组进行OCR文字识别;针对每组视频帧组,基于对应语音识别得到的预测文本和对应文字识别得到的识别文本,结合结巴分词和拼音相似度,确定预测文本中存在待纠正词,并结合三元语言模型,利用对应识别文本对待纠正词进行替换;针对每组视频帧组,将替换后的文本或预测文本存放至区隔标记DIV标签中,以及将对应视频帧存放至与DIV标签关联的图片标签中,得到超文本标记语言HTML网页。本发明既保证了网页内容的准确性,又便于用户阅(56)对比文件闫建鹏;封化民;刘嘉琦.一种基于多模态特征的新闻视频语义提取框架.计算机应用研究.2012,(第07期),第2725-2729页.
公开/授权文献
- CN117194818A 基于视频的图文网页生成方法及装置 公开/授权日:2023-12-08