对话策略获取方法、装置及相关设备
摘要:
本申请提供一种对话策略获取方法、装置及相关设备,其中,方法包括获取用于表征当前对话状态的第一信息,基于第一信息,获得当前对话状态对应的第一隐向量,再根据第一隐向量模拟K段单动作对话,获得对话策略。本申请实施例提供的方法提高了MADPL对真实场景的泛化效果。
0/0