一种装置信息词典的生成方法及计算装置
摘要:
本发明实施例公开了一种装置信息词典的生成方法,用于通过多次迭代直至算法收敛,得到最终的参考词典。本发明实施例方法包括:获取第一当前词典和原始保护装置信息;根据第一当前词典对原始保护装置信息进行分词处理,得到第一分词结果;对第一分词结果进行频率统计,得到每个字词的第一出现频率;构造第一向量;将第一向量添加到第一集合中;若第一字词对应的第一目标出现频率满足第一预设条件,则计算第一字词的左侧字词与第一字词的第一互信息最大值;计算第一字词与第一字词的第一右侧字词的第一互信息;若第一互信息大于第一互信息最大值,则在第一当前词典中删除第一字词,且将第一目标字词添加到第一当前词典中,得到第二当前词典。
公开/授权文献
0/0