发明公开
- 专利标题: 多语言文本检测与纠错方法、系统、电子设备及存储介质
-
申请号: CN202111576592.8申请日: 2021-12-22
-
公开(公告)号: CN114282527A公开(公告)日: 2022-04-05
- 发明人: 杨子清 , 韦菁 , 崔一鸣 , 伍大勇 , 陈志刚
- 申请人: 中科讯飞互联(北京)信息科技有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
- 申请人地址: 北京市海淀区西北旺东路10号院东区5号楼3层311-2; ;
- 专利权人: 中科讯飞互联(北京)信息科技有限公司,河北省讯飞人工智能研究院,科大讯飞股份有限公司
- 当前专利权人: 中科讯飞互联(北京)信息科技有限公司,河北省讯飞人工智能研究院,科大讯飞股份有限公司
- 当前专利权人地址: 北京市海淀区西北旺东路10号院东区5号楼3层311-2; ;
- 代理机构: 深圳紫藤知识产权代理有限公司
- 代理商 方世栋
- 主分类号: G06F40/232
- IPC分类号: G06F40/232 ; G06F40/30 ; G06F40/58 ; G06F40/242 ; G06F40/289 ; G06F16/35 ; G06K9/62 ; G06N3/04 ; G06N3/08
摘要:
本发明提供一种多语言文本检测与纠错方法、系统、电子设备及存储介质,所述方法包括获取待检测文本,并对所述待检测文本进行多语言字符识别以得到至少一个待识别语句;对所述待识别语句中的目标语言的字符进行语种检测,得到待检测语种单词,并对所述待检测语种单词进行拼写检测和语义检测;若至少一个所述待检测语种单词存在拼写错误和/或语义错误,则对存在拼写错误和/或语义错误的单词进行对应的拼写纠错和/或语义纠错。本发明可以更好地理解跨语言语境下的文本语义,对文本中的所有目标语言的字符进行检测并只对检测有错误的单词进行纠正。