基于语义表示的文本生成方法和装置
Abstract:
本申请公开了基于语义表示的文本生成方法和装置,涉及NLP领域。文本生成方法为:获取输入文本;获取目标文本之中第i个待预测词的占位符;获取第i个待预测词的向量表示,其中,第i个待预测词的向量表示是对应的占位符与源文本和第1个至第i‑1个预测词,通过自注意力机制计算得到的;根据第i个待预测词的向量表示,生成第i个预测词,以获取目标文本。该方法通过引入占位符,融合源文本和当前已预测出的词,得到与当前待预测词的向量表示,根据该向量表示预测当前待预测词,解码时即使预测出的前一个词错误,对当前待预测词的向量表示影响较小,在一定程度上缓解了曝光偏差,提高了解码准确率。上述方法可统一应用于预训练和微调。
Public/Granted literature
Patent Agency Ranking
0/0