-
公开(公告)号:CN112732934B
公开(公告)日:2022-05-27
申请号:CN202110029159.6
申请日:2021-01-11
申请人: 国网山东省电力公司电力科学研究院 , 北京邮电大学 , 国家电网有限公司
IPC分类号: G06F16/36 , G06F16/35 , G06F16/33 , G06F40/211 , G06F40/242 , G06F40/247 , G06F40/295 , G06N3/04 , G06N3/08
摘要: 一种电网设备分词词典和故障案例库构建方法,构建了电网领域分词词典,然后对故障案例数据进行格式转换、分词等预处理,然后运用多种技术手段,从文本数据中分析生成结构化电网设备故障案例、特征标签、关键词云、关联规则等信息。为上述信息设计关系型数据库Schema,以报告为主键,将上述文本信息和预处理中保留的图片、作者等信息一起入库,形成电网设备故障案例库。提升了电网领域文本的分词准确性,结构化的案例数据库使根据案例内容的检索更为准确,将故障案例数据库中的特征标签作为项集,整理挖掘故障的有效关联规则,可用于故障预警,填补了电网领域文本分析技术应用的空白。提升了电网领域语料的应用价值,降低了查阅成本。
-
公开(公告)号:CN112732934A
公开(公告)日:2021-04-30
申请号:CN202110029159.6
申请日:2021-01-11
申请人: 国网山东省电力公司电力科学研究院 , 北京邮电大学 , 国家电网有限公司
IPC分类号: G06F16/36 , G06F16/35 , G06F16/33 , G06F40/211 , G06F40/242 , G06F40/247 , G06F40/295 , G06N3/04 , G06N3/08
摘要: 一种电网设备分词词典和故障案例库构建方法,构建了电网领域分词词典,然后对故障案例数据进行格式转换、分词等预处理,然后运用多种技术手段,从文本数据中分析生成结构化电网设备故障案例、特征标签、关键词云、关联规则等信息。为上述信息设计关系型数据库Schema,以报告为主键,将上述文本信息和预处理中保留的图片、作者等信息一起入库,形成电网设备故障案例库。提升了电网领域文本的分词准确性,结构化的案例数据库使根据案例内容的检索更为准确,将故障案例数据库中的特征标签作为项集,整理挖掘故障的有效关联规则,可用于故障预警,填补了电网领域文本分析技术应用的空白。提升了电网领域语料的应用价值,降低了查阅成本。
-