一种文本分类方法及装置

    公开(公告)号:CN109657064A

    公开(公告)日:2019-04-19

    申请号:CN201910151793.X

    申请日:2019-02-28

    Abstract: 本发明公开了一种文本分类方法,包括:获取训练样本;对所述训练样本进行分词,得到分词列表;根据所述分词列表确定词频文档矩阵,并计算分词列表中各词语的TF-IDF值矩阵;将所述词语作为变量输入模型,根据CV图获取最佳λ值和最优变量个数范围;将所述最优λ值作为参数拟合lasso回归模型,并输出特征变量;以特征词的词频文档矩阵创建训练容器;构建所述训练样本的SLDA有监督模型;通过Lasso回归模型得到的特征变量集合,并根据所述特征变量集合更新所述词频文档矩阵;在所述词频文档矩阵上应用训练好的SLDA模型,输出预测结果和预测概率。本发明成本低且效率高,可推广性强,可以剔除人的主观因素对结果的影响。

    一种电力客户画像生成管理的方法及系统

    公开(公告)号:CN108764663A

    公开(公告)日:2018-11-06

    申请号:CN201810460650.2

    申请日:2018-05-15

    CPC classification number: G06Q10/067 G06Q30/01 G06Q50/06

    Abstract: 本发明提供了一种电力客户画像生成管理的方法及系统,其方法主要包括:通过大数据处理技术与机器学习算法得到精炼的特征标识,建立动态标签模型;调用相关动态标签模型生成动态标签,并开始标签的全生命周期管理;结合已有标签自动增加新标签,并对所有标签覆盖情况重新计算、展示,直观展示其在总客户中的分布情况;结合已有标签设计新业务场景下的客户分群规则,并对其进行多维度分析;结合业务经验及原有相关策略,制定差异化服务策略;对外接通业务系统,推送制定好的针对不同渠道的差异化信息推送策略。本发明以标签形式构建客户全景画像,实现对电力客户特征的精细刻画;并基于此设计客户分群规则,制定相应的差异化营销管理策略。

    基于分级分类的非结构化数据资产防泄露方法

    公开(公告)号:CN104866780B

    公开(公告)日:2018-01-05

    申请号:CN201510202687.1

    申请日:2015-04-24

    Abstract: 本发明公开了一种基于分级分类的非结构化数据资产防泄露方法,包括以下步骤:a.受控终端对非结构化的数据资产进行分类分级,并进行数字签名;b.当受控终端请求向Internet或者Extranet发送非结构化数据时,网络防护服务器通过镜像的流量和敏感关键词对该数据进行过滤处理;c.若所述的非结构化数据中包含敏感关键词,则采用相应敏感级的公钥对该非结构化数据的签名进行验证;d.若通过验证,则阻断该受控终端向Internet或者Extranet发送数据的请求。本发明通过采用关键词过滤和数据标签相结合的方法对企业分级分类数据资产中的非结构化数据进行防护,从而可以有效防止数据泄露并降低信息防护的误报现象。

Patent Agency Ranking