Invention Grant
- Patent Title: 基于语义表示的文本生成方法和装置
-
Application No.: CN202010076485.8Application Date: 2020-01-23
-
Publication No.: CN111310449BPublication Date: 2021-01-26
- Inventor: 张涵 , 肖东凌 , 李宇琨 , 孙宇 , 田浩 , 吴华 , 王海峰
- Applicant: 北京百度网讯科技有限公司
- Applicant Address: 北京市海淀区上地十街10号百度大厦2层
- Assignee: 北京百度网讯科技有限公司
- Current Assignee: 北京百度网讯科技有限公司
- Current Assignee Address: 北京市海淀区上地十街10号百度大厦2层
- Agency: 北京清亦华知识产权代理事务所
- Agent 王艳斌
- Main IPC: G06F40/274
- IPC: G06F40/274 ; G06F40/30
Abstract:
本申请公开了基于语义表示的文本生成方法和装置,涉及NLP领域。文本生成方法为:获取输入文本;获取目标文本之中第i个待预测词的占位符;获取第i个待预测词的向量表示,其中,第i个待预测词的向量表示是对应的占位符与源文本和第1个至第i‑1个预测词,通过自注意力机制计算得到的;根据第i个待预测词的向量表示,生成第i个预测词,以获取目标文本。该方法通过引入占位符,融合源文本和当前已预测出的词,得到与当前待预测词的向量表示,根据该向量表示预测当前待预测词,解码时即使预测出的前一个词错误,对当前待预测词的向量表示影响较小,在一定程度上缓解了曝光偏差,提高了解码准确率。上述方法可统一应用于预训练和微调。
Public/Granted literature
- CN111310449A 基于语义表示的文本生成方法和装置 Public/Granted day:2020-06-19
Information query