发明公开
- 专利标题: 一种基于机器学习算法的输变电设备缺陷数据机器自主聚类工具
- 专利标题(英): Power transmission and transformation equipment defect data machine self-clustering tool based on machine learning algorithm
-
申请号: CN201210189266.6申请日: 2012-06-08
-
公开(公告)号: CN102737350A公开(公告)日: 2012-10-17
- 发明人: 李锐海 , 刘磊 , 廖永力 , 杨晴 , 邓安明 , 高尚飞 , 尹福荣 , 邓丽林 , 张玉龙 , 邓全燕 , 陈达 , 杨远帜 , 陆叶
- 申请人: 南方电网科学研究院有限责任公司 , 昆明能讯科技有限责任公司
- 申请人地址: 广东省广州市越秀区东风东路水均岗6、8号西塔13-20楼
- 专利权人: 南方电网科学研究院有限责任公司,昆明能讯科技有限责任公司
- 当前专利权人: 南方电网科学研究院有限责任公司,昆明能讯科技有限责任公司
- 当前专利权人地址: 广东省广州市越秀区东风东路水均岗6、8号西塔13-20楼
- 代理机构: 昆明大百科专利事务所
- 代理商 何健
- 主分类号: G06Q50/06
- IPC分类号: G06Q50/06
摘要:
一种基于机器学习算法的输变电设备缺陷数据机器自主聚类工具,它由数据分解器(1)、聚类器(2)、结果处理器(3)组成,用于分类处理输变电设备缺陷数据。本发明具有把目前杂乱能力输变电设备缺陷数据分类的能力,能从文字描述中提取关键信息,能自主学习,自我完善。主要核心算法是最大匹配算法的两种变体的中文单词识别(MMSEG)、词频、反文档算法(TFIDF)和支持向量机(SVM),MMSEG用于分解知识,词频、反文档算法用于评估信息内某类信息的重要程度,SVM用来处理机器学习问题。