-
公开(公告)号:CN113704451B
公开(公告)日:2023-01-13
申请号:CN202111007388.4
申请日:2021-08-30
发明人: 黄园芳 , 郑世明 , 段新辉 , 吴莉琳 , 徐沛东 , 罗宗杰 , 林荣秋 , 程超鹏 , 李旺军 , 彭显刚 , 陈宇钊 , 王志强 , 徐达艺 , 王晓明 , 魏焱 , 李玲 , 付振宇 , 吴超成 , 郝鑫
IPC分类号: G06F16/335 , G06F16/35 , G06F40/216 , G06F40/242 , G06F40/253 , G06F40/289 , G06F40/30 , G06F40/194 , G06F16/951 , G06F16/9537 , G06Q30/02 , G06Q50/06
摘要: 本申请公开了一种电力用户诉求筛选方法、系统、电子设备和存储介质,其方法通过电力专业词汇、地理位置名称和工单类别构建分词语料库,并利用HMM分词模型的分词机理进行分词处理,从而降低分词复杂度,同时,提取分词中的词性特征、TF‑IDF特征、词长特征和主题模型特征,并对各个特征赋予权值得到分词的综合权重值,根据综合权重值筛选出关键词,并根据关键词及其综合权重值确定高热度工单文本,并通过潜在语义分析LSA算法确定高热度工单文本间的相似程度,从而将相似程度高的工单文本进行整合,再对整合后的相似工单集合进行筛选出热点工单,以确定用户热点诉求。从而解决了95598工单缺乏对客户需求的深度挖掘分析的技术问题。