-
公开(公告)号:CN112949255A
公开(公告)日:2021-06-11
申请号:CN201911267701.0
申请日:2019-12-11
申请人: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 清华大学
IPC分类号: G06F40/126 , G06F40/284 , G06F40/30 , G06F40/247
摘要: 本发明提供一种词向量训练方法及装置,该方法包括:对单词的初始化词向量的进行预训练,得到预训练词向量;使用语义融合的释义自编码器对所述预训练词向量进行训练,得到目标词向量;其中,所述语义融合的释义自编码器融合所述单词的语义关系和所述单词的词典释义;本发明实施例在语义融合的释义自编码器中融合语义关系和词典释义,显著提高词向量对语义相似性的建模能力;使用该语义融合的释义自编码器训练得到的目标词向量具有很强的普适性,且该词向量训练方法还具有训练时间短、资源消耗少等优势。
-
-
公开(公告)号:CN109460450B
公开(公告)日:2021-07-09
申请号:CN201811131847.8
申请日:2018-09-27
申请人: 清华大学
IPC分类号: G06F16/332 , G06F16/35 , G06F16/36 , G06F40/289 , G06F40/30
摘要: 本申请涉及一种对话状态跟踪方法、装置、计算机设备和存储介质,通过获取当前轮对话文本,根据所述对话文本与富对话状态跟踪规则,确定当前轮对话语义,再根据所述对话语义与上一轮对话状态,更新当前轮对话状态。采用本方法能够提高对话的鲁棒性、一槽取多值以及表达用户对所取值的偏好。
-
-