Invention Publication
- Patent Title: 一种基于左右信息熵和互信息的新词发现方法以及装置
-
Application No.: CN202111391884.4Application Date: 2021-11-19
-
Publication No.: CN114330336APublication Date: 2022-04-12
- Inventor: 黄敬林 , 林振天 , 池少宁 , 杨梦琳
- Applicant: 福建亿榕信息技术有限公司 , 国网信息通信产业集团有限公司 , 国网信通亿力科技有限责任公司
- Applicant Address: 福建省福州市鼓楼区软件大道89号G区20号楼; ;
- Assignee: 福建亿榕信息技术有限公司,国网信息通信产业集团有限公司,国网信通亿力科技有限责任公司
- Current Assignee: 福建亿榕信息技术有限公司,国网信息通信产业集团有限公司,国网信通亿力科技有限责任公司
- Current Assignee Address: 福建省福州市鼓楼区软件大道89号G区20号楼; ;
- Agency: 福州市鼓楼区京华专利事务所
- Agent 王美花
- Main IPC: G06F40/289
- IPC: G06F40/289 ; G06F40/237 ; G06F40/216

Abstract:
本发明提供一种基于左右信息熵和互信息的新词发现方法以及装置,方法包括:从文本中选择设定规则的语句数据,并进行处理,得到处理数据;将处理数据进行分词操作,得到分词数据;根据分词数据建立字典树;基于字典树,并根据互信息和信息熵从分词数据中获取新词,并进行存储;可以提高信息存储效率以及检索的准确性,提高办公效率。
Information query