一种基于融合信息的大模型输出生成方法、介质及设备

    公开(公告)号:CN118606465A

    公开(公告)日:2024-09-06

    申请号:CN202410964222.9

    申请日:2024-07-18

    摘要: 本发明涉及大语言模型领域,特别是涉及一种基于融合信息的大模型输出生成方法、介质及设备。包括:若存在任意问答参考记录中还包括行程查询标记,则获取行程信息;按照相似度对多个问答参考信息进行排序拼接,生成初始参考信息;将行程信息与初始参考信息拼接,生成次级参考信息;将初始输入及次级参考信息进行拼接后,生成第二目标输入;将第二目标输入加载至目标领域对应的专用大语言模型中,以生成对应的输出。本发明中根据行程查询标记,来确定想要获取的答案为更加准确的信息。由此通过是否携带有行程查询标记,来确定要将第一目标输入加载至专用大语言模型还是通用大语言模型中。以克服大语言模型的“幻觉”问题,对用户的影响。

    一种应答文本的生成方法、电子设备及存储介质

    公开(公告)号:CN117033613A

    公开(公告)日:2023-11-10

    申请号:CN202311049585.1

    申请日:2023-08-18

    摘要: 本发明提供了一种应答文本的生成方法、电子设备及存储介质,涉及应答文本生成领域,所述方法包括:获取目标用户输入的问题文本A;将A输入至预设的文本检索模型,以使所述文本检索模型根据A输出与A匹配的文本列表TA;根据预设的文本拼接模版,将A和TA进行拼接以生成A对应的目标问题文本QA;将QA输入至预设的目标文本生成模型,以使所述目标文本生成模型根据QA输出与A匹配的应答文本;目标文本匹配模型能够结合属于预设领域内的与问题文本匹配的文本来生成应答文本,从而提高生成的应答文本与对应问题文本的垂直度,提高生成应答文本的准确性。

    一种文本匹配方法、电子设备及存储介质

    公开(公告)号:CN117033612A

    公开(公告)日:2023-11-10

    申请号:CN202311048339.4

    申请日:2023-08-18

    摘要: 本发明提供了一种文本匹配方法、电子设备及存储介质,涉及文本匹配领域,所述方法包括:获取目标用户输入的问题文本A;将A输入至第一文本匹配模块,以通过各文本排序子模型均匹配出f个匹配文本,进而得到匹配文本列表集H;将H输入至文本召回子模型,以使所述文本召回子模型确定H内各匹配文本的绝对置信度,得到H对应的匹配文本绝对置信度列表TH;根据TH,获取与A匹配各匹配文本作为第一目标文本,以得到的第一目标文本集B1;本发明能够确保输出问题文本对应的第一目标文本的准确性。

    一种应答信息确定方法、电子设备及存储介质

    公开(公告)号:CN116383366A

    公开(公告)日:2023-07-04

    申请号:CN202310659045.9

    申请日:2023-06-06

    IPC分类号: G06F16/332 G06F16/335

    摘要: 本发明提供了一种应答信息确定方法、电子设备及存储介质,所述方法包括以下步骤:获取目标用户输入的目标问题文本句A;将A输入至预设的目标文本段确定模型W1,得到与A对应的目标答案信息A1;将A1输入至预设的目标文本句确定模型W2,得到第一答案文本句B1;获取预设时间窗口t内用户输入的历史问题文本句集Q;根据Q,获取第二答案文本句集A’;根据Q,获取第三答案文本句集B;根据A’和B,获取W2生成文本句的正确率η,η=k’/k,k’为B中bj与A’中a’j相匹配的个数;若η≥η’,将B1作为A的应答信息;该方法解决了根据用户输入的查询信息获取答案的准确率较低的问题,且能够保证应答信息不被遗漏。

    信息处理方法、装置、计算机设备及存储介质

    公开(公告)号:CN114328882A

    公开(公告)日:2022-04-12

    申请号:CN202210206947.2

    申请日:2022-03-04

    IPC分类号: G06F16/332 G06F40/30

    摘要: 本申请提供了一种信息处理方法、装置、计算机设备及存储介质,方法主要包括:输出第一用户意图对应的意图回复或意图问题;若输出的为第一用户意图对应的意图问题,判断是否能够从用户针对意图问题输入的第二信息中获取到目标内容;若不能,判断是否能够从第二信息中获取到第二用户意图;若能够,则输出第二用户意图对应的意图回复,及输出是否跳转到继续第一用户意图对应的意图问题的提示信息;若接收到用户的确认,则输出第一用户意图对应的意图问题;若不能够获取到第二信息对应的第二用户意图,判断输出第一用户意图对应的意图问题的次数是否达到预置次数;若未达到,再次输出第一用户意图对应的意图问题;若达到,输出预置回复内容。

    智能问答数据处理系统
    7.
    发明公开

    公开(公告)号:CN113220864A

    公开(公告)日:2021-08-06

    申请号:CN202110771766.X

    申请日:2021-07-08

    IPC分类号: G06F16/332 G06F16/35

    摘要: 本发明涉及一种智能问答数据处理系统,包括预设数据库,预设模型库{第一模型,第二模型,…第G模型}、处理器和存储有计算程序的存储器,所述预设数据库包括FAQ库和基于用户query实时基于预设查询接口获取的问答信息。本发明基于预训练模型和无监督的召回方法,解决了数据冷启动问题,基于预训练模型微调和文本多标签分类模型的召回方法,提升了召回准确率,基于多路召回的融合排序模型,提高了智能问答的准确性和时间效能。

    用于网页数据抽取的数据处理方法、存储介质及电子设备

    公开(公告)号:CN115827953B

    公开(公告)日:2023-05-12

    申请号:CN202310134131.8

    申请日:2023-02-20

    摘要: 本发明提供了一种用于网页数据抽取的数据处理方法、存储介质及电子设备,其包括:获取目标网页的待处理访问路径数据A1=(a1,a2,...,ai,...,an),i=1,2,...,n;其中,ai为在目标网站中与目标网页对应的第i级网页的标题,目标网页为目标网站中的任一网页;n为获取到的在目标网站中与目标网页对应的网页的标题的数量;确定目标网页的标题a0与an是否相同;若相同,则将A1作为处理后访问路径数据A2;否则,获取处理后访问路径数据A2=(a1,a2,...,ai,...,an,a0);在若干意图中,确定出A2对应的意图作为第一目标意图。由此,本发明确定目标网页的意图的准确度较高。

    用于民航智能问答的输入联想方法、电子设备及存储介质

    公开(公告)号:CN115840510B

    公开(公告)日:2023-04-28

    申请号:CN202310141654.5

    申请日:2023-02-21

    摘要: 本发明提供了一种用于民航智能问答的输入联想方法,包括:获取输入的目标字符串和其长度,如果长度大于设定长度,遍历目标实体词库,对于当前目标实体词库,如果目标字符串中包含当前目标实体词库中的任一实体词,则从当前库中获取与对应的固定语句作为当前输出结果;如果小于设定长度,从第一设定语料库中获取以所述目标字符串开头的语句,如果获取到对应的目标语句,则将获取到的目标语句作为输出结果;对所述目标字符串进行分词处理,得到分词集;从第二设定语料库中获取对应的语句,得到对应的语句集;如果语句集存在交集,将交集得到的语句作为输出结果;输出结果。本发明还提供一种电子设备和存储介质。本发明能够输出尽可能丰富的联想词。

    用于民航智能问答的输入联想方法、电子设备及存储介质

    公开(公告)号:CN115840510A

    公开(公告)日:2023-03-24

    申请号:CN202310141654.5

    申请日:2023-02-21

    摘要: 本发明提供了一种用于民航智能问答的输入联想方法,包括:获取输入的目标字符串和其长度,如果长度大于设定长度,遍历目标实体词库,对于当前目标实体词库,如果目标字符串中包含当前目标实体词库中的任一实体词,则从当前库中获取与对应的固定语句作为当前输出结果;如果小于设定长度,从第一设定语料库中获取以所述目标字符串开头的语句,如果获取到对应的目标语句,则将获取到的目标语句作为输出结果;对所述目标字符串进行分词处理,得到分词集;从第二设定语料库中获取对应的语句,得到对应的语句集;如果语句集存在交集,将交集得到的语句作为输出结果;输出结果。本发明还提供一种电子设备和存储介质。本发明能够输出尽可能丰富的联想词。