文本相似度的确定方法、装置、存储介质及电子装置

    公开(公告)号:CN114818651A

    公开(公告)日:2022-07-29

    申请号:CN202210303278.0

    申请日:2022-03-25

    Abstract: 本申请公开了一种文本相似度的确定方法、装置、存储介质及电子装置,涉及智能家居/智慧家庭技术领域,该文本相似度的确定方法包括:获取待确定文本相似度的多个文本;对多个文本进行第一特征提取,得到初始特征向量;基于初始特征向量计算注意力权重,得到多个目标特征向量;将多个目标特征向量转换为文本向量,其中,文本向量用于指示多个文本中每个文本所表达的语义信息以及多个文本之间的语义关系;根据文本向量确定多个文本之间的目标相似度。解决了相关技术中,文本相似度的确定效率较低等问题,实现了提高文本相似度的确定效率的技术效果。

    文本增强处理方法、装置、设备及存储介质

    公开(公告)号:CN114817527A

    公开(公告)日:2022-07-29

    申请号:CN202210275130.0

    申请日:2022-03-21

    Inventor: 刘建国 王迪 彭强

    Abstract: 本申请提供的一种文本增强处理方法、装置、设备及存储介质,包括:获取至少两个分类标签以及所述分类标签对应的文本数据,根据所述分类标签对应的文本数据的数量,确定待处理文本数据;对所述待处理文本数据进行增强处理,得到增强后的文本数据;其中,所述增强处理包括:同义词替换、随机插入词语、随机交换词语、随机删除词语中的至少一个以及对所述待处理文本数据语义处理;计算所述增强后的文本数据与所述待处理文本数据的语义相似度,得到所述语义相似度结果,根据所述语义相似度结果确定训练样本数据。采用本技术方案,能够有效提高数据增强后的数据量的质量,而不是简单地在数量上做了增加。

    语义识别方法、装置及电子设备
    77.
    发明公开

    公开(公告)号:CN114330359A

    公开(公告)日:2022-04-12

    申请号:CN202111447228.1

    申请日:2021-11-30

    Inventor: 刘建国 王迪 朱毅

    Abstract: 本申请属于自然语言处理技术领域,具体涉及一种语义识别方法、装置及电子设备。方法包括:获取目标语句;当确定目标语句中存在待语义消歧的目标词语时,判断目标语句中是否存在各目标词语对应的语义指示词;语义指示词用于确定目标词语的语义;若确定目标语句中存在无语义指示的目标词语,则将目标语句输入语义消歧模型,得到各无语义指示的目标词语的语义;无语义指示的目标词语指的是在目标语句中不存在对应的语义指示词的目标词语;根据目标语句中的各目标词语的语义,得到目标语句的语义。本申请减少了语义识别计算量且提高了语义识别的效率。

Patent Agency Ranking