-
公开(公告)号:CN119622001A
公开(公告)日:2025-03-14
申请号:CN202510156421.1
申请日:2025-02-12
Applicant: 之江实验室
IPC: G06F16/36 , G06F16/353 , G06F40/279 , G06F40/30
Abstract: 本说明书公开了一种大模型幻觉测评数据生成方法。在此方法中,可以通过实体识别和关系抽取技术,从预先构建的针对不同领域范围的知识库中提取出结构化的知识图谱,进而可以根据知识图谱中各节点之间的连接关系,结合大语言模型生成幻觉测评数据,以对待测试模型针对非直观或模糊信息时的表现进行测评。同时,以原始实体在知识库中对应的文本数据为依据,提供详尽的参考答案,形成文本对。最终得到一套全面的幻觉测评数据集,用以评估待测试模型的理解力和输出信息的准确性。
-
公开(公告)号:CN119622001B
公开(公告)日:2025-04-25
申请号:CN202510156421.1
申请日:2025-02-12
Applicant: 之江实验室
IPC: G06F16/36 , G06F16/353 , G06F40/279 , G06F40/30
Abstract: 本说明书公开了一种大模型幻觉测评数据生成方法。在此方法中,可以通过实体识别和关系抽取技术,从预先构建的针对不同领域范围的知识库中提取出结构化的知识图谱,进而可以根据知识图谱中各节点之间的连接关系,结合大语言模型生成幻觉测评数据,以对待测试模型针对非直观或模糊信息时的表现进行测评。同时,以原始实体在知识库中对应的文本数据为依据,提供详尽的参考答案,形成文本对。最终得到一套全面的幻觉测评数据集,用以评估待测试模型的理解力和输出信息的准确性。
-
公开(公告)号:CN119622749B
公开(公告)日:2025-05-02
申请号:CN202510156422.6
申请日:2025-02-12
Applicant: 之江实验室
Abstract: 本说明书公开了一种红队测试指令生成方法、装置、存储介质。在此方法中,可以借助大型语言模型的强大逻辑推理与内容生成能力,基于不同的目标进化策略以及少量的候选测试指令,从广度方面或从深度方面批量生成多样化的能够生成不同领域范围下能够覆盖更多潜在威胁场景的红队测试指令,以减少对安全专家手工编写测试指令的需求,极大提高了测试效率,并降低测试成本。
-
公开(公告)号:CN119622749A
公开(公告)日:2025-03-14
申请号:CN202510156422.6
申请日:2025-02-12
Applicant: 之江实验室
Abstract: 本说明书公开了一种红队测试指令生成方法、装置、存储介质。在此方法中,可以借助大型语言模型的强大逻辑推理与内容生成能力,基于不同的目标进化策略以及少量的候选测试指令,从广度方面或从深度方面批量生成多样化的能够生成不同领域范围下能够覆盖更多潜在威胁场景的红队测试指令,以减少对安全专家手工编写测试指令的需求,极大提高了测试效率,并降低测试成本。
-
-
-