发明公开
- 专利标题: 一种电力数据预测训练样本优化方法及系统
-
申请号: CN202210577240.2申请日: 2022-05-25
-
公开(公告)号: CN115017981A公开(公告)日: 2022-09-06
- 发明人: 骆晨 , 吴凯 , 冯玉 , 吴少雷 , 张成龙 , 宫兴龙 , 管仁静 , 李健 , 戚振彪 , 徐飞 , 张征凯 , 周建军 , 陈振宁
- 申请人: 国网安徽省电力有限公司电力科学研究院 , 国网安徽省电力有限公司 , 国网安徽省电力有限公司芜湖供电公司
- 申请人地址: 安徽省合肥市经济开发区紫云路299号; ;
- 专利权人: 国网安徽省电力有限公司电力科学研究院,国网安徽省电力有限公司,国网安徽省电力有限公司芜湖供电公司
- 当前专利权人: 国网安徽省电力有限公司电力科学研究院,国网安徽省电力有限公司,国网安徽省电力有限公司芜湖供电公司
- 当前专利权人地址: 安徽省合肥市经济开发区紫云路299号; ;
- 代理机构: 合肥市浩智运专利代理事务所
- 代理商 朱文振
- 主分类号: G06K9/62
- IPC分类号: G06K9/62 ; G06N3/08 ; G06Q10/04 ; G06Q50/06
摘要:
本发明提供一种电力数据预测训练样本优化方法包括:采集获取电力结构化信息,根据所述电力结构化信息处理得架空线样本数据;处理所述架空线样本数据,以得到正常数据集和异常数据集;处理所述正常数据集和所述异常数据集,以获取异常样本簇和正常样本簇;谱聚类处理所述异常样本簇和所述正常样本簇,以得到负谱类聚中心数据和正谱类聚中心数据;邻采样处理所述正谱类聚中心数据,以降低所述正常样本簇的规模;插值处理所述负谱类聚中心数据,以扩充较少样本规模。本发明通过离线的谱聚类算法与数据增强算法,平衡训练数据的正负样本分布,使得随机森林和神经网络训练性能得到极大提升。