发明公开
CN106776540A 一种自由化文本生成方法
无效 - 驳回
- 专利标题: 一种自由化文本生成方法
- 专利标题(英): Free text generation method
-
申请号: CN201611036777.9申请日: 2016-11-23
-
公开(公告)号: CN106776540A公开(公告)日: 2017-05-31
- 发明人: 王琪鑫 , 王东 , 游世学 , 骆天一 , 邢超 , 杜新凯
- 申请人: 清华大学 , 北京中科汇联科技股份有限公司
- 申请人地址: 北京市海淀区清华园;
- 专利权人: 清华大学,北京中科汇联科技股份有限公司
- 当前专利权人: 清华大学,北京中科汇联科技股份有限公司
- 当前专利权人地址: 北京市海淀区清华园;
- 代理机构: 北京庆峰财智知识产权代理事务所
- 代理商 李文军
- 主分类号: G06F17/27
- IPC分类号: G06F17/27 ; G06N3/04
摘要:
本发明公开了一种自由化文本生成方法,包括以下步骤:S1、将用户输入的关键词组合成字符串;S2、第一循环神经网络将所述字符串编码成一组维度为i的词向量,并根据词向量生成隐向量;S3、第二循环神经网络根据所述词向量和隐向量生成第t个字的候选集,并预测第t个字的候选集的概率分布向量,其中t≥1;S4、按照文本格式要求将候选集中概率分布最大维的字作为预测字Yt进行输出,通过循环迭代生成全部文本。本发明的文本生成方法实现同时训练字词的映射信息和字词的语义信息,可以利用多种格式的文本进行学习,解决了数据稀疏问题,且该方法可以生成任意长度、任意句子的文本。