一种基于左右信息熵和互信息的新词发现方法以及装置
Abstract:
本发明提供一种基于左右信息熵和互信息的新词发现方法以及装置,方法包括:从文本中选择设定规则的语句数据,并进行处理,得到处理数据;将处理数据进行分词操作,得到分词数据;根据分词数据建立字典树;基于字典树,并根据互信息和信息熵从分词数据中获取新词,并进行存储;可以提高信息存储效率以及检索的准确性,提高办公效率。
Patent Agency Ranking
0/0