基于视频的图文网页生成方法及装置

发明授权

CN117194818B 基于视频的图文网页生成方法及装置有权

请登陆查看更多内容

专利标题： 基于视频的图文网页生成方法及装置
申请号： CN202311475166.4

申请日： 2023-11-08
公开(公告)号： CN117194818B

公开(公告)日： 2024-01-16
发明人: 刘成书 , 唐海霞 , 王涛 , 韩博 , 刘真 , 高凌辉 , 李文永 , 卫世杰 , 孙思遥 , 高树奎 , 张小师 , 刘亚伟
申请人： 北京信立方科技发展股份有限公司
申请人地址： 北京市西城区新街口外大街28号B座416室(德胜园区)
专利权人： 北京信立方科技发展股份有限公司
当前专利权人： 北京信立方科技发展股份有限公司
当前专利权人地址： 北京市西城区新街口外大街28号B座416室(德胜园区)
代理机构： 北京路浩知识产权代理有限公司
代理商 耿琦
主分类号： G06F16/9538
IPC分类号： G06F16/9538 ; G06V20/62 ; G06V30/19 ; G06V30/26 ; G06F16/33 ; G06F16/738 ; G06F16/783

摘要：

本发明提供一种基于视频的图文网页生成方法及装置，涉及互联网技术领域，方法包括：获取包括至少一组视频帧组的视频帧序列，以及获取各视频帧组对应的语音数据；对各语音数据进行语音识别；对各视频帧组进行OCR文字识别；针对每组视频帧组，基于对应语音识别得到的预测文本和对应文字识别得到的识别文本，结合结巴分词和拼音相似度，确定预测文本中存在待纠正词，并结合三元语言模型，利用对应识别文本对待纠正词进行替换；针对每组视频帧组，将替换后的文本或预测文本存放至区隔标记DIV标签中，以及将对应视频帧存放至与DIV标签关联的图片标签中，得到超文本标记语言HTML网页。本发明既保证了网页内容的准确性，又便于用户阅(56)对比文件闫建鹏;封化民;刘嘉琦.一种基于多模态特征的新闻视频语义提取框架.计算机应用研究.2012,(第07期),第2725-2729页.

公开/授权文献

CN117194818A 基于视频的图文网页生成方法及装置公开/授权日：2023-12-08

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F16/00	信息检索；数据库结构；文件系统结构
G06F16/90	.•与检索数据类型无关的数据库功能
G06F16/95	..••从网上检索
G06F16/953	...•••查询，例如通过使用网络搜索引擎
G06F16/9538	....••••查询结果可视化