问答任务处理方法、装置、设备、存储介质及程序产品

    公开(公告)号:CN119441453A

    公开(公告)日:2025-02-14

    申请号:CN202411285071.0

    申请日:2024-09-13

    Abstract: 本发明提供一种问答任务处理方法、装置、设备、存储介质及程序产品,应用于自然语言处理技术领域。该方法包括:获取问答任务的输入问题和问答实例;从所述问答实例中确定与所述输入问题相似度最高的目标实例,从预训练的低秩适配LORA模块库中确定与所述目标实例相似度最高的多个LORA模块;采用非梯度参数优化技术将所述多个LORA模块与第一问答模型进行融合处理,得到第二问答模型,并将所述输入问题输入所述第二问答模型得到对应回答。

    用于控制大型语言模型的人格特点的方法及装置

    公开(公告)号:CN118940814A

    公开(公告)日:2024-11-12

    申请号:CN202410848998.4

    申请日:2024-06-27

    Abstract: 本申请提供一种用于控制大型语言模型的人格特点的方法及装置,涉及生成式人工智能推理技术领域。所述方法包括:提取大型语言模型的人格特征差异向量;基于所述人格特征差异向量,调整所述大型语言模型的激活值,得到目标激活值;基于所述目标激活值,控制所述大型语言模型的人格特点,以使所述大型语言模型的输出符合预设需求。本申请提供的用于控制大型语言模型的人格特点的方法及装置,可以精确控制大型语言模型人格特点,改善任务完成效果。

    端到端概念体系构建方法及系统

    公开(公告)号:CN117313738B

    公开(公告)日:2024-11-12

    申请号:CN202311094760.9

    申请日:2023-08-28

    Abstract: 本发明提供一种端到端概念体系构建方法及系统,方法包括:将待构建概念集合包括的第一词语对中的任一词语添加到初始概念体系中,所述第一词语对为从所述待构建概念集合包括的词语对之间上下位关系所对应的第一概率分布中,得到的概率最大的词语对;执行至少一次第一处理过程,直至所述待构建概念集合为空为止,根据更新后的初始概念体系,获取所述待构建概念集合对应的概念体系。所述系统执行所述方法。本发明基于词语对之间上下位关系的概率分布,每次选择概率最大的特定词语对添加到概念体系中,构建待构建概念集合的概念体系,能够更为准确的表征待构建概念集合中词语之间的语义特征。

    模型的训练方法、装置、电子设备、存储介质和计算机程序产品

    公开(公告)号:CN118916693A

    公开(公告)日:2024-11-08

    申请号:CN202410947007.8

    申请日:2024-07-15

    Abstract: 本公开关于模型的训练方法、装置、电子设备、存储介质和计算机程序产品,该方法包括:将训练演示和训练指令输入超网络编码器内;将编码结果输入适配器生成器内;基于适配器权重调整学生模型;将训练输入和编码结果输入调整后的学生模型;将训练数据输入教师模型,获得教师输出分布;计算训练损失;基于训练损失对超网络和学生模型进行训练。这样,可以基于训练演示和训练指令利用适配器生成器获得适配器权重,即可以自动从训练指令中生成特定任务的适配器,而无需对未见任务进行重新训练,降低了对大量标记数据的依赖,可以提高模型的跨任务泛化能力。并且,还可以实现降低计算开销、节省计算成本,提高了模型在实际应用中的适应性和灵活性。

    知识结构持续扩展方法、装置、设备和介质

    公开(公告)号:CN114925164A

    公开(公告)日:2022-08-19

    申请号:CN202210476432.4

    申请日:2022-04-29

    Abstract: 本发明提供一种知识结构持续扩展方法、装置、设备和介质,该方法包括:查找出待扩展知识节点在现有知识体系中的父节点;在父节点为非叶子节点的情况下,基于多节点标记方法在现有知识体系中查找出待扩展知识节点所有的孩子节点;基于父节点及所有的孩子节点,将待扩展知识节点插入至现有知识体系中,由此在待扩展知识节点为非叶子节点时,通过进行父亲节点和孩子节点的寻找,实现高效、精确地将待扩展知识节点插入至现有知识体系中。

    一种基于大模型的人物知识图谱复杂问答推理的智能体方法

    公开(公告)号:CN119513330A

    公开(公告)日:2025-02-25

    申请号:CN202411695690.7

    申请日:2024-11-25

    Abstract: 本发明公开了一种基于大模型的人物知识图谱复杂问答推理的智能体方法。该方法包括:基于多种召回方式,根据待回答问题动态匹配对应的提示示例,所述多种召回方式包括嵌入向量相似度匹配、字符串模糊匹配、融合匹配的任一种;采用少样本提示的方式,利用大语言模型进行待回答问题的关键实体识别、关系筛选、多候选实体递归搜索,获得待回答问题的各子问题的待选实体集;基于待选实体集,利用大语言模型以智能体的方式迭代生成思考、行动,并通过与知识图谱交互得到的观察结果,多轮交互后得到最终的答案。本发明以高质量的提示增强大语言模型的推理能力。

    对齐增强语义解析方法、装置和计算机程序产品

    公开(公告)号:CN115062603B

    公开(公告)日:2024-11-29

    申请号:CN202210557374.8

    申请日:2022-05-20

    Abstract: 本发明涉及自然语言处理技术领域,提供一种对齐增强语义解析方法、装置和计算机程序产品,所述方法包括:预测知识问答任务中对应对齐关系的短语,并基于对应对齐关系的短语的类型生成对应的查询片段,其中,对齐关系包括短语和对应的查询片段;将序列化的对齐关系拼接至输入序列,并将输入序列输入编码器‑解码器解析模型的编码器模型,获取对齐的编码结果;将对齐的编码结果进行注意力操作并输入编码器‑解码器解析模型的解码器模型,解析并输出对齐关系对应的查询语句,其中,解码器模型是利用含噪对齐训练获得。本发明可实现较大粒度的建模对齐,且提高解析准确度及噪声对解析模型的鲁棒性。

Patent Agency Ranking