基于文本分析的视频匹配系统
摘要:
一种基于文本分析的视频匹配系统,包括:字幕分析模块、索引模块和搜索模块,其中:字幕分析模块提取字幕文件中的文字内容以及文字内容在视频中出现的时间,采用结巴分词对文字内容进行分词,并对分词后的文字内容采用TF-IDF算法得到文字内容的字幕关键字以及字幕关键字在视频中出现的开始时间和结束时间,索引模块根据字幕关键字及其开始时间和结束时间后采用哈希索引方法建立或更新视频索引,搜索模块根据用户输入的搜索关键字与视频索引中的字幕关键字对比并返回相似性最大的视频列表,本发明实现了根据字幕提自动建立索引的过程,保证了搜索结果的准确性,帮助用户快速定位搜索关键字在视频中对应的时间区间。
0/0