一种一对多的混合字符串融合比对方法
摘要:
本发明公开了一种一对多的混合字符串融合比对方法,将一个源字符串从一组待比对字符串中找到最相似或匹配目标字符串。首先用改进的GST*算法,再使用一种偏有序的字符串比对算法POC。结合以上两种算法分别在字符串无序、部分有序匹配方面各自的特点,将两种算法计算得到的匹配度值进行加权融合求得最终的匹配度。另外,针对同义字符串在不同场合下具有不同的表达方式,采用字符串等价替换策略,对源字符串、待比对字符串中同义字符子串等价替换成相同的字符串,大大提高两个字符串的匹配度。通过将源字符串与一组待匹配字符串分别匹配,再将各匹配度进行排序,将最高匹配度的字符串作为目标字符串,实现了一对多的混合字符串的较佳匹配。
公开/授权文献
0/0