Invention Publication
- Patent Title: 一种文本生成与数据增强方法、装置及存储介质
-
Application No.: CN202310912957.2Application Date: 2023-07-24
-
Publication No.: CN117195905APublication Date: 2023-12-08
- Inventor: 张阳 , 姜松浩 , 程冕 , 朱天 , 黄亮 , 黄恬 , 熊颖 , 戴光耀 , 周炎龙 , 陈万祺 , 戚艳红 , 李高超 , 强倩 , 涂登彪 , 周立 , 王博
- Applicant: 国家计算机网络与信息安全管理中心
- Applicant Address: 北京市朝阳区裕民路甲3号
- Assignee: 国家计算机网络与信息安全管理中心
- Current Assignee: 国家计算机网络与信息安全管理中心
- Current Assignee Address: 北京市朝阳区裕民路甲3号
- Agency: 北京清亦华知识产权代理事务所
- Agent 罗文群
- Main IPC: G06F40/30
- IPC: G06F40/30 ; G06F40/289 ; G06F40/205 ; G06F40/247 ; G06F40/58 ; G06F18/22 ; G06F18/241

Abstract:
本发明涉及自然语言处理技术领域,尤其是指一种文本生成与数据增强方法、装置及存储介质。本发明所述的文本生成与数据增强方法,对数据情感极性进行判断,可在保持数据情感极性不变的情况下,实现数据增强;使用多类型数据增强算法,针对同一文本,可提高进行数据增强后的结果多样性,实现样本数据的生成积累;通过多类型数据增强方法积累的样本,不仅可以用于分类模型、识别模型的训练,还可用于同义句转换、昵称、口头禅等的多样生成,可应用于媒体出版、新闻媒体、诗歌创等领域。
Information query