- 专利标题: 文本信息处理方法、装置、电子设备及可读存储介质
-
申请号: CN201910804709.X申请日: 2019-08-28
-
公开(公告)号: CN110674396B公开(公告)日: 2021-04-27
- 发明人: 王雷 , 张睿 , 宋祺 , 周锴
- 申请人: 北京三快在线科技有限公司
- 申请人地址: 北京市海淀区北四环西路9号2106-030
- 专利权人: 北京三快在线科技有限公司
- 当前专利权人: 北京三快在线科技有限公司
- 当前专利权人地址: 北京市海淀区北四环西路9号2106-030
- 代理机构: 北京润泽恒知识产权代理有限公司
- 代理商 任亚娟
- 主分类号: G06F16/9535
- IPC分类号: G06F16/9535 ; G06F16/9538
摘要:
本申请实施例提供了一种文本信息处理方法、装置、存储介质和电子设备,所述方法包括:对待修正的文本识别结果进行分词处理,得到多个文本条目;将所述待修正的文本识别结果输入搜索引擎,得到至少一条搜索结果;将所述多个文本条目中的每个文本条目与该条搜索结果分别进行匹配,以得到该文本条目在所述该条搜索结果中的匹配结果;将所述多个文本条目中的每个文本条目对应的匹配结果进行拼接,以得到所述至少一条搜索结果中每条搜索结果的拼接结果,各条所述拼接结果的集合形成候选结果集;将所述待修正的文本识别结果与所述候选结果集中的各条拼接结果分别进行匹配,确定修正后的文本识别结果。以提高文本识别结果纠错的准确率。
公开/授权文献
- CN110674396A 文本信息处理方法、装置、电子设备及可读存储介质 公开/授权日:2020-01-10