视觉问答方法、模型训练方法、电子设备及可读存储介质
Abstract:
本申请公开了一种视觉问答方法、模型训练方法、电子设备及可读存储介质,该方法包括:获取目标用户通过语音输入的提问文本以及目标商户的基本信息;根据所述提问文本的输入时间获取与所述输入时间对应时间的视频图像数据;将预处理后的所述提问文本、所述基本信息以及所述视频图像数据输入至预先训练好的视觉问答模型中,输出目标答复文本;将所述目标答复文本转换为语音向所述目标用户输出。
Patent Agency Ranking
0/0