- 专利标题: 文本处理方法、装置、电子设备及可读存储介质
-
申请号: CN202411060017.6申请日: 2024-08-05
-
公开(公告)号: CN118569215A公开(公告)日: 2024-08-30
- 发明人: 贾敬伍 , 于皓 , 张杰
- 申请人: 北京中关村科金技术有限公司
- 申请人地址: 北京市通州区张家湾镇光华路5号二层228室
- 专利权人: 北京中关村科金技术有限公司
- 当前专利权人: 北京中关村科金技术有限公司
- 当前专利权人地址: 北京市通州区张家湾镇光华路5号二层228室
- 代理机构: 北京银龙知识产权代理有限公司
- 代理商 刘念
- 主分类号: G06F40/16
- IPC分类号: G06F40/16 ; G06F40/279 ; G06N20/00
摘要:
本发明提供一种文本处理方法、装置、电子设备及可读存储介质,属于自然语言处理技术领域。该方法包括:获取目标语言识别文本;获取每行对话文本的第一要素信息和第二要素信息,目标语言识别文本中任一行第一对话文本的第二要素信息与M行对话文本关联,M行对话文本包括第一对话文本和目标语言识别文本中对话时刻在第一对话文本之前的对话文本,M行对话文本的第一要素信息中要素名称相同;根据对话文本段对应的第一要素信息和第二要素信息,确定对话文本段的第三要素信息;根据对话文本段和第三要素信息,确定大模型的训练数据,大模型用于对语言识别文本进行要素抽取。
公开/授权文献
- CN118569215B 文本处理方法、装置、电子设备及可读存储介质 公开/授权日:2024-10-11