一种问答模型训练方法、装置、设备及存储介质

    公开(公告)号:CN117851548A

    公开(公告)日:2024-04-09

    申请号:CN202211193394.8

    申请日:2022-09-28

    摘要: 本申请提供了一种问答模型训练方法、装置、设备及存储介质,能够解决问答模型在文档中没有问题的答案时,会出现输出错误答案的问题。该方法包括:获取第一数量的问答正样本和第二数量的问答负样本,其中每个所述问答正样本由问题、包含所述问题的答案的文档以及所述问题的答案标签构成,每个所述负样本由问题、不包含所述问题的答案的文档以及无答案标签构成;根据所述第一数量的问答正样本和所述第二数量的问答负样本,对问答模型进行训练。

    基于城市问答系统的领域识别方法及设备

    公开(公告)号:CN116842145A

    公开(公告)日:2023-10-03

    申请号:CN202310426515.7

    申请日:2023-04-20

    摘要: 本申请公开了基于城市问答系统的领域识别方法及设备,预先保存不同用户的身份标识信息与领域的对应关系,在接收目标用户的问答请求信息之后,获取其中携带的目标语言文本信息和目标身份标识信息,然后根据上述对应关系确定出目标身份标识信息对应的目标领域。从用户身份的角度实现领域识别,解决了不同领域之间的语言文本信息十分相似,导致深度学习模型识别领域不准确的问题,提高了领域识别的准确性。当根据目标身份标识信息识别目标领域失败时,基于领域识别模型,通过目标语言文本信息和目标身份标识信息两个维度的信息进行领域识别,提高了领域识别的准确性。本申请所包含的技术方案具有准确率高、推理速度快的特点,符合可信赖性特点。

    一种多跳问答模型训练方法及设备

    公开(公告)号:CN118113819A

    公开(公告)日:2024-05-31

    申请号:CN202211527888.5

    申请日:2022-11-30

    IPC分类号: G06F16/332 G06F18/214

    摘要: 本申请实施例提供了一种多跳问答模型训练方法及设备,将问答样本数据及噪声标识输入到第一多跳问答模型中,在第一多跳问答模型根据噪声标识确定该问答样本数据为噪声数据时,获取该第一多跳问答模型输出的第一识别答案,根据第一识别答案及对应的标准答案确定第一损失值,根据第一损失值对第一多跳问答模型进行训练,同时将问答样本数据输入到第二多跳问答模型中,获取第二多跳问答模型输出的第二识别答案,根据第二识别答案及对应的标准答案确定第二损失值,根据第二损失值对第二多跳问答模型进行训练,经过第二设定数量次迭代后,采用第一多跳问答模型的参数,对第二多跳问答模型的参数进行调整,有效提高了多跳问答模型训练的效果。

    一种文本纠错方法、装置、设备及介质

    公开(公告)号:CN117852527A

    公开(公告)日:2024-04-09

    申请号:CN202211210091.2

    申请日:2022-09-30

    摘要: 本申请实施例提供了一种文本纠错方法、装置、设备及介质,由于在本申请实施例中,在文本纠错模型输出纠错后的第二文本之后,电子设备会根据目标关键词在第一文本中的第一位置范围、该第二文本及该文本纠错模型预测的第一文本中的每个位置字符对应的预测字符数,确定该目标关键词在第二文本中的第二位置范围,并采用目标关键词对第二位置范围中的内容进行替换,使得第二文本中包含目标关键词,避免了对目标关键词出现过纠或错纠的情况。

    基于城市问答系统的领域识别方法及设备

    公开(公告)号:CN116842145B

    公开(公告)日:2024-02-27

    申请号:CN202310426515.7

    申请日:2023-04-20

    摘要: 本申请公开了基于城市问答系统的领域识别方法及设备,预先保存不同用户的身份标识信息与领域的对应关系,在接收目标用户的问答请求信息之后,获取其中携带的目标语言文本信息和目标身份标识信息,然后根据上述对应关系确定出目标身份标识信息对应的目标领域。从用户身份的角度实现领域识别,解决了不同领域之间的语言文本信息十分相似,导致深度学习模型识别领域不准确的问题,提高了领域识别的准确性。当根据目标身份标识信息识别目标领域失败时,基于领域识别模型,通过目标语言文本信息和目标身份标识信息两个维度的信息进行领域识别,提高了领域识别的准确性。本申请所包含的技术方案具有准确率高、推理速度快的特点,符合可信赖性特点。

    一种序列识别方法及设备
    6.
    发明公开

    公开(公告)号:CN118114665A

    公开(公告)日:2024-05-31

    申请号:CN202211522901.8

    申请日:2022-11-30

    发明人: 张烘玮 孟卫明

    IPC分类号: G06F40/295 G06F18/214

    摘要: 本申请实施例提供了一种序列识别方法及设备,用以解决现有技术中所确定的文字对应的实体类别不准确的问题。由于在本申请实施例中,电子设备在获取到待识别序列中每个文字对应的实体类别后,根据同一槽位对应的位置之间的顺序以及每个文字在对应的槽位的位置,对不满足同一槽位对应的位置之间的顺序的文字对应的位置进行调整,从而可以使得每个文字对应的槽位的位置,均满足同一槽位对应的位置之间的顺序,进而可以提高文字对应的实体类别确定的准确性。

    一种数据处理方法及设备
    7.
    发明公开

    公开(公告)号:CN118036600A

    公开(公告)日:2024-05-14

    申请号:CN202211383150.6

    申请日:2022-11-07

    IPC分类号: G06F40/284 G06F40/186

    摘要: 本申请实施例提供了一种数据处理方法及设备,用以解决现有技术中待识别信息对应的槽位包含无规则槽位时,确定的槽位及槽位对应的关键词不准确的问题。由于在本申请实施例中,电子设备识别待识别信息对应的目标意图,确定目标意图对应的目标槽位组,在目标槽位组中包含无规则槽位时,通过待识别信息中是否存在和预先保存的每个关键词模板中任一关键词匹配的关键词,确定待识别信息对应的无规则槽位,及无规则槽位对应的目标关键词,从而可以在待识别信息对应的槽位中包含无规则槽位时,准确地确定待识别信息对应的无规则槽位,及无规则槽位对应的目标关键词,也就是说可以准确地确定待识别信息对应的槽位,及槽位对应的关键词。