-
公开(公告)号:CN113051455A
公开(公告)日:2021-06-29
申请号:CN202110346900.1
申请日:2021-03-31
申请人: 合肥供水集团有限公司 , 合肥工业大学 , 科大国创软件股份有限公司
IPC分类号: G06F16/951 , G06F16/33 , G06F40/284
摘要: 本发明公开了一种基于网络文本数据的水务舆情识别方法,其步骤包括:1、与水务相关的网络文本数据的获取,2、与水务相关的网络文本数据的预处理,3、与水务相关的网络文本数据的分析以及水务舆情的关注点发现。本发明能根据网址的类型确定网页搜索策略,实现快速从海量网络数据中获取与水务相关的文本数据,并且结合主题分析发现水务舆情关注点,以实现水务舆情识别,从而能提高水务舆情识别的效率和准确性,并且其结果具有良好的可解释性。
-
公开(公告)号:CN113051455B
公开(公告)日:2022-04-26
申请号:CN202110346900.1
申请日:2021-03-31
申请人: 合肥供水集团有限公司 , 合肥工业大学 , 科大国创软件股份有限公司
IPC分类号: G06F16/951 , G06F16/33 , G06F40/284
摘要: 本发明公开了一种基于网络文本数据的水务舆情识别方法,其步骤包括:1、与水务相关的网络文本数据的获取,2、与水务相关的网络文本数据的预处理,3、与水务相关的网络文本数据的分析以及水务舆情的关注点发现。本发明能根据网址的类型确定网页搜索策略,实现快速从海量网络数据中获取与水务相关的文本数据,并且结合主题分析发现水务舆情关注点,以实现水务舆情识别,从而能提高水务舆情识别的效率和准确性,并且其结果具有良好的可解释性。
-
公开(公告)号:CN112905741A
公开(公告)日:2021-06-04
申请号:CN202110183557.3
申请日:2021-02-08
申请人: 合肥供水集团有限公司 , 合肥工业大学
IPC分类号: G06F16/33 , G06F16/335 , G06F40/30
摘要: 本发明公开了一种考虑时空特征的供水用户关注点挖掘方法,其步骤包括:1.基于时间维度数据,构建T个带时间标签的用水文本数据;2.基于空间维度数据,构建K个带空间标签的用水文本数据;3.基于时间和空间维度数据,构建T×K个带时‑空标签的用水文本数据;4.对所述用户反馈的用水文本数据进行去停用词、语义对齐以及分词处理,得到预处理后的用水文本数据;5.利用TF‑IDF在微观局部上挖掘出用户用水的关注点;6.利用主题模型在宏观整体上挖掘出用户用水的关注点。本发明能通过对用户反馈的用水文本数据进行挖掘,从而能快速且精确的得到用户对用水的关注点,并结合TF‑IDF和主题模型技术,在微观局部与宏观整体上实现结果的对比。
-
公开(公告)号:CN112905741B
公开(公告)日:2022-04-12
申请号:CN202110183557.3
申请日:2021-02-08
申请人: 合肥供水集团有限公司 , 合肥工业大学
IPC分类号: G06F16/33 , G06F16/335 , G06F40/30
摘要: 本发明公开了一种考虑时空特征的供水用户关注点挖掘方法,其步骤包括:1.基于时间维度数据,构建T个带时间标签的用水文本数据;2.基于空间维度数据,构建K个带空间标签的用水文本数据;3.基于时间和空间维度数据,构建T×K个带时‑空标签的用水文本数据;4.对所述用户反馈的用水文本数据进行去停用词、语义对齐以及分词处理,得到预处理后的用水文本数据;5.利用TF‑IDF在微观局部上挖掘出用户用水的关注点;6.利用主题模型在宏观整体上挖掘出用户用水的关注点。本发明能通过对用户反馈的用水文本数据进行挖掘,从而能快速且精确的得到用户对用水的关注点,并结合TF‑IDF和主题模型技术,在微观局部与宏观整体上实现结果的对比。
-
公开(公告)号:CN113205368A
公开(公告)日:2021-08-03
申请号:CN202110569868.3
申请日:2021-05-25
申请人: 合肥供水集团有限公司
摘要: 本发明公开了一种基于时序用水数据的工商户聚类方法,其步骤包括:1.构建工商户的日用水量数据并进行数据预处理工作;2.基于LSTM模型对时序用水数据进行学习与表征;3.基于用水趋势对工商户进行聚类;4.在依据用水趋势聚类的基础上再基于用水范围对工商户进行聚类;5.对聚类结果进行可视化展示。本发明能通过LSTM模型学习到工商户时序用水数据中隐藏的丰富的用水模式和趋势信息,以此作为工商户的用水特征表示,再结合kmeans算法能准确且快速地完成工商户基于用水趋势和用水量范围两方面因素的聚类。
-
公开(公告)号:CN113205368B
公开(公告)日:2022-11-29
申请号:CN202110569868.3
申请日:2021-05-25
申请人: 合肥供水集团有限公司
摘要: 本发明公开了一种基于时序用水数据的工商户聚类方法,其步骤包括:1.构建工商户的日用水量数据并进行数据预处理工作;2.基于LSTM模型对时序用水数据进行学习与表征;3.基于用水趋势对工商户进行聚类;4.在依据用水趋势聚类的基础上再基于用水范围对工商户进行聚类;5.对聚类结果进行可视化展示。本发明能通过LSTM模型学习到工商户时序用水数据中隐藏的丰富的用水模式和趋势信息,以此作为工商户的用水特征表示,再结合kmeans算法能准确且快速地完成工商户基于用水趋势和用水量范围两方面因素的聚类。
-
-
-
-
-