-
公开(公告)号:CN116257623A
公开(公告)日:2023-06-13
申请号:CN202211091826.4
申请日:2022-09-07
申请人: 中债金科信息技术有限公司
IPC分类号: G06F16/35 , G06F40/289 , G06F40/242 , G06F40/30
摘要: 本发明提供一种文本情感分类模型训练方法、文本情感分类方法及设备,应用于自然语言处理、人工智能技术领域,该方法包括:分别对多个文本样本进行分词处理,基于文本样本对应的分词结果,确定文本样本的实体特征向量序列和情感特征向量序列;基于实体特征向量序列,确定文本样本对应的实体表征;基于情感特征向量序列、通用领域的情感词典和特定领域的情感词典,确定文本样本对应的情感表征;基于样本文本对应的实体表征和情感表征,确定文本样本中各实体对应的情感分类预测结果;基于情感分类预测结果,调整初始文本情感分类模型的模型参数,得到文本情感分类模型。该方法可以提高文本情感分类模型的适用性,提升了情感分类结果的准确度。
-
公开(公告)号:CN116257623B
公开(公告)日:2023-11-28
申请号:CN202211091826.4
申请日:2022-09-07
申请人: 中债金科信息技术有限公司
IPC分类号: G06F16/35 , G06F40/289 , G06F40/242 , G06F40/30
摘要: 本发明提供一种文本情感分类模型训练方法、文本情感分类方法及设备,应用于自然语言处理、人工智能技术领域,该方法包括:分别对多个文本样本进行分词处理,基于文本样本对应的分词结果,确定文本样本的实体特征向量序列和情感特征向量序列;基于实体特征向量序列,确定文本样本对应的实体表征;基于情感特征向量序列、通用领域的情感词典和特定领域的情感词典,确定文本样本对应的情感表征;基于样本文本对应的实体表征和情感表征,确定文本样本中各实体对应的情感分类预测结果;基于情感分类预测结果,调整初始文本情感分类模型的模型参数,得到文本情感分类模型。该方法可以提高文
-
公开(公告)号:CN116306602A
公开(公告)日:2023-06-23
申请号:CN202310581556.3
申请日:2023-05-23
申请人: 中债金科信息技术有限公司
IPC分类号: G06F40/247 , G06F40/284 , G06F40/166 , G06F40/117 , G06N20/00
摘要: 本发明提供一种文本数据增强方法、装置、电子设备及存储介质,涉及自然语言处理技术领域,该方法包括:获取带标签的第一文本集;基于训练好的预训练模型,确定第一文本集中的每个第一文本中的多个重点词,并从第一文本集中确定多个重点词各自对应的同义词,将各重点词替换为对应的同义词,得到第二文本集;计算第二文本集中的每个第二文本对应的困惑度;从第二文本集中的各第二文本中确定困惑度小于预设阈值的第三文本,并基于训练好的预训练模型预测每个第三文本的标签,得到增强后的带标签的第三文本集。本发明不依赖人工设计的同义词库且可以保证增强后的文本集依然符合自然语言规则。
-
-