-
公开(公告)号:CN119848252A
公开(公告)日:2025-04-18
申请号:CN202411903109.6
申请日:2024-12-23
Applicant: 吉林科讯信息科技有限公司
IPC: G06F16/35 , G06F40/30 , G06F40/284 , G06F18/213 , G06F18/25
Abstract: 本发明提供一种文本分类方法、装置、电子设备和存储介质,所述方法包括:提取待分类文本的语义特征;基于重点分词先验信息,增强待分类文本中的重点分词特征,得到重点增强特征;基于边缘分词先验信息,弱化待分类文本中的边缘分词特征,得到边缘弱化特征;基于语义特征、重点增强特征以及边缘弱化特征,确定待分类文本的分类结果。本发明在提取语义特征的基础上,不仅可以基于重点增强特征准确捕捉对待分类文本分类有重要影响的关键信息,又可以基于弱化边缘特征忽略边缘信息影响,减少边缘分词对分类结果的干扰,进一步提高文本分类的准确性。