-
公开(公告)号:CN117992607A
公开(公告)日:2024-05-07
申请号:CN202410122650.7
申请日:2024-01-29
IPC分类号: G06F16/35 , G06N3/0442 , G06N3/08 , G06Q50/06
摘要: 本发明属于电力系统监测技术领域,具体公开了一种电力用户画像构建方法、装置、设备及介质。包括:获取客服通话数据;转换为文本数据,并根据文本数据建立样本集;根据样本集构建标注数据集和未标注数据集;根据标注样本集构建文本分类模型;给未标注数据集赋予伪标签,根据伪标签从未标注数据集中划分出精选集;将精选集和标注数据集合并得到合并集,根据合并集进行训练,输出最后的文本分类模型作为最优模型;通过最优模型建立电力用户画像并输出。本发明有效利用大量未标注数据,通过迭代训练提升模型准确率,实现了低人力成本的用户画像构建。本发明通过音频文本化获得用户常遇电力问题类别的分类模型,有助于用户画像的构建。