Invention Publication
CN109522559A 一种电网营配系统中文分词的方法及系统
失效 - 权利终止
- Patent Title: 一种电网营配系统中文分词的方法及系统
-
Application No.: CN201811417689.2Application Date: 2018-11-26
-
Publication No.: CN109522559APublication Date: 2019-03-26
- Inventor: 李志 , 夏同飞 , 章玉龙 , 郭振 , 王超 , 张学敏 , 岳想想 , 费晓璐
- Applicant: 安徽继远软件有限公司 , 国网信息通信产业集团有限公司 , 国网安徽省电力有限公司电力科学研究院
- Applicant Address: 安徽省合肥市高新区习友路1800号
- Assignee: 安徽继远软件有限公司,国网信息通信产业集团有限公司,国网安徽省电力有限公司电力科学研究院
- Current Assignee: 安徽继远软件有限公司,国网信息通信产业集团有限公司,国网安徽省电力有限公司电力科学研究院
- Current Assignee Address: 安徽省合肥市高新区习友路1800号
- Agency: 合肥汇融专利代理有限公司
- Agent 赵宗海
- Main IPC: G06F17/27
- IPC: G06F17/27

Abstract:
本发明提供一种电网营配系统中文分词的方法,包括步骤:建立电网营配分词词库;选取预设场景对应的分词词库;对待处理数据的前2个字按所述步骤二中的分词词库进行逐个哈希索引;对所述处理数据的剩余字串按预设顺序进行排列,根据所述步骤二中的分词词库对排列后的数据进行逐字匹配;提取样本数据形成大数据训练集和验证集;对分词特征指标进行评价。本发明提出在经典的词典分词方法基础上提出改进TRIE索引树的分词方法,进一步提出了双数组Trie分词方法,更能适应电力业务环境;通过结合电力业务场景需求提出一种中文分词方法,高效、准确提取电力业务对象的特征信息,特征提取满足一定的同义识别率、歧义识别率和新词识别率指标。
Public/Granted literature
- CN109522559B 一种电网营配系统中文分词的方法及系统 Public/Granted day:2023-03-31
Information query