-
公开(公告)号:CN113010680A
公开(公告)日:2021-06-22
申请号:CN202110297290.0
申请日:2021-03-19
Applicant: 国网河北省电力有限公司营销服务中心 , 国家电网有限公司 , 国网河北省电力有限公司电力科学研究院
IPC: G06F16/35 , G06F40/284 , G06F40/289 , G06F40/30 , G06N3/04 , G06N3/08 , G06Q50/06
Abstract: 本发明适用于文本分类技术领域,公开了一种电力工单文本分类方法、装置及终端设备,上述方法包括:获取电力工单文本,并对电力工单文本进行预处理得到多行预处理后的工单文本;基于预设预训练模型和每行预处理后的工单文本,得到每行工单文本对应的词向量集;预训练模型为在BERT模型中引入SDAE得到的模型;基于预设特征提取模型和每行工单文本对应的词向量集,得到电力工单文本的局部特征矩阵;基于预设文本向量提取模型和局部特征矩阵,得到电力工单文本的文本向量;将文本向量输入预设分类模型中,得到电力工单文本的分类结果。本发明能够提高电力工单文本分类的准确性,满足电力行业的应用需求。