-
公开(公告)号:CN114970541A
公开(公告)日:2022-08-30
申请号:CN202210513371.4
申请日:2022-05-12
Applicant: 吉林科讯信息科技有限公司
IPC: G06F40/30 , G06F40/279 , G06F40/56 , G06F40/253
Abstract: 本申请公开了一种文本语义理解方法、装置、设备及存储介质,本申请可以将源语种的目标文本翻译为目标语种的翻译后文本,其中源语种可以是小语种,目标语种可以是多资源样本语种,进而可以利用目标语种下较好的语义理解模型完成对源语种的目标文本的语义理解任务,解决了小语种文本语义理解结果准确性不高的问题。可知的,目标文本中的实体词对于语义理解过程是很重要的信息,本申请在将源语种的目标文本翻译为目标语种之前,首先识别出目标文本中的实体词并确定其在目标语种下的映射实体词,避免在翻译过程中出现实体丢失的问题,在此情况下,可以基于映射实体词及翻译后文本确定语义理解结果,能够进一步提升语义理解结果的准确性。