一种特色话语的校对方法及设备
摘要:
本发明公开一种特色话语的校对方法及设备,方法包括如下步骤:构建AC自动机:收集所有大于等于三个字的特色话语,将特色话语进行Ngram切分片段,将特色话语与切分后的片段进行关联,并将特色话语与切分后的片段放入AC自动机,形成特色话语AC自动机;文本校对:传入待校对文本,排除正确的特色话语,对剩下的内容进行分句,匹配到包含特色话语的片段SUB,将所有SUB进行依次合并、计算与对应的FULL的相似度、计算相似度趋势,通过趋势将合并的SUB作为疑似错误MayErr_SUB,通过困惑度计算MayErr_SUB原文内容的困惑度与替换后内容的困惑度,保留困惑度低的为校对结果。
公开/授权文献
0/0