视频文本匹配模型训练、视频文本匹配方法和装置

    公开(公告)号:CN115204301A

    公开(公告)日:2022-10-18

    申请号:CN202210868349.1

    申请日:2022-07-22

    IPC分类号: G06K9/62 G06N3/08

    摘要: 本申请涉及一种视频文本匹配模型训练、视频文本匹配方法、装置、计算机设备、存储介质和计算机程序产品。本申请涉及人工智能技术。所述方法包括:将训练样本对集合中训练视频对应的视频特征、参考特征和训练文本对应的训练文本特征输入初始视频文本匹配模型;参考特征包括音频特征和动作特征中的至少一种;基于同一训练视频对应的参考特征对相应的视频特征进行特征增强,得到训练视频对应的参考增强视频特征;将训练文本对应的训练文本特征,分别和训练视频对应的视频特征、参考增强视频特征进行相似度计算;基于各个训练样本对所对应的相似度集合训练初始视频文本匹配模型,得到目标视频文本匹配模型。采用本方法能够提高模型预测准确性。