发明授权
- 专利标题: 一种限定采样文本序列生成方法及其系统
-
申请号: CN201911200838.4申请日: 2019-11-29
-
公开(公告)号: CN111027292B公开(公告)日: 2021-05-28
- 发明人: 杨杨 , 丹晓东 , 房超 , 喻鹏 , 徐思雅 , 邵苏杰 , 郭少勇 , 陶卓 , 董婧 , 王建鑫 , 刘祖龙
- 申请人: 北京邮电大学 , 北京智芯微电子科技有限公司
- 申请人地址: 北京市海淀区西土城路10号北京邮电大学;
- 专利权人: 北京邮电大学,北京智芯微电子科技有限公司
- 当前专利权人: 北京邮电大学,北京智芯微电子科技有限公司
- 当前专利权人地址: 北京市海淀区西土城路10号北京邮电大学;
- 代理机构: 北京路浩知识产权代理有限公司
- 代理商 郑朝然
- 主分类号: G06F40/166
- IPC分类号: G06F40/166 ; G06F40/242 ; G06F40/30 ; G06N3/04 ; G06N3/08
摘要:
本发明实施例提供的限定采样文本序列生成方法及系统,该方法包括:将初始文本序列输入对抗网络模型,获取预输出文本序列的第一个词;基于词表掩模的方法,利用生成器根据第一个词,从字典数据库中选取第一个词的下一个词,构成预输出文本序列;基于词表掩模的方法,根据预输出文本序列,继续选取预输出文本序列的下一个词,获取新的预输出文本序列,直至总词数达到设定阈值,将其输入至判别器进行判别,并根据分类判别结果计算更新梯度;更新生成器的参数,并再次输入初始文本序列至更新后的生成器中;直至生成器和判别器均收敛后,输出目标文本序列。本实施例提供的方法及系统,通过改进制定文本规则精简了采样空间,改善了生成文本质量。
公开/授权文献
- CN111027292A 一种限定采样文本序列生成方法及其系统 公开/授权日:2020-04-17