发明公开
- 专利标题: 文本数据生成方法、计算机设备及存储介质
-
申请号: CN202111647750.4申请日: 2021-12-29
-
公开(公告)号: CN114357985A公开(公告)日: 2022-04-15
- 发明人: 呼啸 , 巩捷甫 , 宋巍 , 盛志超 , 王士进 , 陈志刚 , 胡国平 , 秦兵 , 刘挺
- 申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 中科讯飞互联(北京)信息科技有限公司
- 申请人地址: 安徽省合肥市合肥市高新开发区望江西路666号; ;
- 专利权人: 科大讯飞股份有限公司,河北省讯飞人工智能研究院,中科讯飞互联(北京)信息科技有限公司
- 当前专利权人: 科大讯飞股份有限公司,河北省讯飞人工智能研究院,中科讯飞互联(北京)信息科技有限公司
- 当前专利权人地址: 安徽省合肥市合肥市高新开发区望江西路666号; ;
- 代理机构: 深圳市力道知识产权代理事务所
- 代理商 何姣
- 主分类号: G06F40/253
- IPC分类号: G06F40/253 ; G06F40/289 ; G06F40/30 ; G06K9/62
摘要:
本申请实施例提供了一种文本数据生成方法、计算机设备及存储介质,文本数据生成方法包括:获取无语法缺陷的第三文本;将所述第三文本输入生成模型,生成所述第三文本对应的第一生成文本,和用于指示所述第一生成文本存在语法缺陷的目标概率,所述生成模型是基于无语法缺陷的第一文本和有语法缺陷的第二文本训练得到的;根据所述第一生成文本对应的目标概率,确定所述第一生成文本为目标文本。生成模型学习到第二文本对应的语法错误规律,训练后的生成模型能够发挥生成结果多样的优异特性,可以自动构建出大量包含语法缺陷的文本。