一种文本分类方法及装置

    公开(公告)号:CN109657064A

    公开(公告)日:2019-04-19

    申请号:CN201910151793.X

    申请日:2019-02-28

    IPC分类号: G06F16/35 G06F17/27

    摘要: 本发明公开了一种文本分类方法,包括:获取训练样本;对所述训练样本进行分词,得到分词列表;根据所述分词列表确定词频文档矩阵,并计算分词列表中各词语的TF-IDF值矩阵;将所述词语作为变量输入模型,根据CV图获取最佳λ值和最优变量个数范围;将所述最优λ值作为参数拟合lasso回归模型,并输出特征变量;以特征词的词频文档矩阵创建训练容器;构建所述训练样本的SLDA有监督模型;通过Lasso回归模型得到的特征变量集合,并根据所述特征变量集合更新所述词频文档矩阵;在所述词频文档矩阵上应用训练好的SLDA模型,输出预测结果和预测概率。本发明成本低且效率高,可推广性强,可以剔除人的主观因素对结果的影响。

    基于属性相似度的数据填补方法、装置、设备及存储介质

    公开(公告)号:CN109033454A

    公开(公告)日:2018-12-18

    申请号:CN201810981153.7

    申请日:2018-08-27

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种基于属性相似度的数据填补方法,在确定出待填补信息系统的各属性信息中含有缺失数据的属性信息之后,就在待填补信息系统中的多个目标对象中查找与各含有缺失数据的属性信息对应的数据,然后依据各目标对象的属性相似度为各目标对象赋权值,对查找到的多个数据进行加权求和,用加权求和后的数据值填补各含有缺失数据的属性信息对应的缺失数据,与现有技术中只选取一个最相似的对象中相同属性信息下的相关数据,直接用选取的该数据去填补缺失数据相比,应用本填补方法,产生的数据误差小,填补的数据准确性高。另外,本发明还公开了一种基于属性相似度的数据填补装置、设备及存储介质,效果如上。

    一种电力客户画像生成管理的方法及系统

    公开(公告)号:CN108764663A

    公开(公告)日:2018-11-06

    申请号:CN201810460650.2

    申请日:2018-05-15

    IPC分类号: G06Q10/06 G06Q30/00 G06Q50/06

    摘要: 本发明提供了一种电力客户画像生成管理的方法及系统,其方法主要包括:通过大数据处理技术与机器学习算法得到精炼的特征标识,建立动态标签模型;调用相关动态标签模型生成动态标签,并开始标签的全生命周期管理;结合已有标签自动增加新标签,并对所有标签覆盖情况重新计算、展示,直观展示其在总客户中的分布情况;结合已有标签设计新业务场景下的客户分群规则,并对其进行多维度分析;结合业务经验及原有相关策略,制定差异化服务策略;对外接通业务系统,推送制定好的针对不同渠道的差异化信息推送策略。本发明以标签形式构建客户全景画像,实现对电力客户特征的精细刻画;并基于此设计客户分群规则,制定相应的差异化营销管理策略。

    一种电力客户画像生成管理的方法及系统

    公开(公告)号:CN108764663B

    公开(公告)日:2020-10-16

    申请号:CN201810460650.2

    申请日:2018-05-15

    IPC分类号: G06F16/00 G06Q10/06

    摘要: 本发明提供了一种电力客户画像生成管理的方法及系统,其方法主要包括:通过大数据处理技术与机器学习算法得到精炼的特征标识,建立动态标签模型;调用相关动态标签模型生成动态标签,并开始标签的全生命周期管理;结合已有标签自动增加新标签,并对所有标签覆盖情况重新计算、展示,直观展示其在总客户中的分布情况;结合已有标签设计新业务场景下的客户分群规则,并对其进行多维度分析;结合业务经验及原有相关策略,制定差异化服务策略;对外接通业务系统,推送制定好的针对不同渠道的差异化信息推送策略。本发明以标签形式构建客户全景画像,实现对电力客户特征的精细刻画;并基于此设计客户分群规则,制定相应的差异化营销管理策略。