一种人工智能视频问答方法
摘要:
本发明公开了一种人工智能视频问答方法,包括以下步骤:S1、获取视觉特征和文字特征;S2、视觉特征提取,对视觉特征和语义特征进行多模态融合,获得融合特征;S3、根据融合特征和语义特征生成答案。本发明公开的人工智能视频问答方法,参数量小,运算速度快,能够正确理解问题和备选答案、各备选答案间的逻辑关系,得到的答案准确率有明显提高。
公开/授权文献
0/0