-
公开(公告)号:CN119046466A
公开(公告)日:2024-11-29
申请号:CN202411225192.6
申请日:2024-09-03
Applicant: 国网冀北电力有限公司信息通信分公司 , 国家电网有限公司 , 南京敏捷企业管理研究所
Inventor: 李欣怡 , 周子阔 , 姚艳丽 , 于然 , 崔彭滔 , 邵博文 , 曲洪泽 , 姜蕴洲 , 张海明 , 温馨 , 王艺霏 , 陈重韬 , 李信 , 李蕴红 , 王沛然 , 才鸿飞 , 臧鹏 , 王婧 , 王阳 , 徐晓川 , 王珣 , 沈宇 , 程明 , 刘蓁 , 王宣元 , 王森 , 尚芳剑 , 彭柏 , 马跃 , 邢海瀛 , 那琼澜 , 王东升 , 杨峰 , 娄竞 , 李坚 , 吴佳 , 张宁 , 张晓东 , 张卫 , 夏凡 , 殷建琳 , 郑立鹤 , 刘延杰 , 瞿鹏 , 任慧芝
IPC: G06F16/35 , G06F16/33 , G06F40/289 , G06F40/30 , G06N3/045 , G06N3/0442 , G06N3/0464 , G06N3/084
Abstract: 本发明属于评论信息智能处理领域,涉及文本特征增强技术、信息主题提取技术、短文本聚合技术与文本情感分析技术,是一种融合长文本主题关键词的评论信息智能分类方法。包括S1、利用BERT模型提取评论信息文本的话题词向量和评论词向量,利用话题注意力层增强评论信息话题特征;S2、采用UMAP算法对评论向量进行降维操作,采用HDBSCAN算法对评论文本进行聚类;S3、构建评论主题核心词集,聚合评论短文本得到评论长文档;S4、采用ProdLDA神经主题模型进行评论主题提取;S5、通过GloVe模型与预训练BERT模型,将评论文本转换成两种不同类型的词嵌入;S6、利用多层神经网络模型对文本进行局部特征提取与上下文信息捕捉;S7、利用情感分类模型对评论文本实现二分类检测。本发明在具体的场景任务下提出优化模型算法,实现了高一致性的评论信息主题挖掘与高精度的评论信息智能分类。