一种视频描述语句生成方法及系统
摘要:
本发明提供一种视频描述语句生成方法及系统,对获取的视频流通过卷积神经网络进行处理,以获得与所述视频流的各帧分别对应的特征向量;根据各所述特征向量,计算相邻帧的相关性,并据以对所述视频流的所有帧进行聚类处理,以将所述视频流对应的所有帧划分为多个类;将所述聚类结果输入循环神经网络,以获得与所述视频流对应的描述语句。本发明创造性加入聚类这一过程,可以更好地对不同时间粒度的局部信息进行描述,防止采用等间隔采样不可避免会丢失部分局部信息的问题,即在减少局部信息丢失的前提下提升处理速度。所以,本发明有效克服了现有技术中的种种缺点而具高度产业利用价值。
0/0