一种提取知识图谱信息的方法及装置

    公开(公告)号:CN118839015A

    公开(公告)日:2024-10-25

    申请号:CN202310443529.X

    申请日:2023-04-23

    IPC分类号: G06F16/36 G06F16/35 G06N5/02

    摘要: 本申请实施例提供一种提取知识图谱信息的方法及装置,应用在人工智能技术领域,包括:根据待识别信息中的多个字的字向量及多个字的位置向量,构建待识别信息的向量序列;第一字的位置向量表征第一字与待识别信息中除第一字以外的其他字的位置关系;将向量序列输入至实体分类层,得到待识别信息的实体词;实体分类层识别实体词开始、实体词内部、实体词尾部、非实体词、与上一实体词关联的实体词开始以及与下一实体词关联的实体词尾部。通过实体分类层识别与上一实体词关联的实体词开始以及与下一实体词关联的实体词尾部,可以识别出待识别信息中的长实体和复杂嵌套实体,提高了知识图谱中知识提取的准确率,同时也提高了知识图谱的构建效率。

    一种槽位信息校正方法、装置、设备及介质

    公开(公告)号:CN117829136A

    公开(公告)日:2024-04-05

    申请号:CN202311637830.0

    申请日:2023-11-30

    摘要: 本申请涉及自然语言处理技术领域,尤其涉及一种槽位信息校正方法、装置、设备及介质。在本申请实施例中,电子设备基于垂直领域外部知识源,构建槽位索引知识库,该槽位索引知识库中保存有每个槽位信息对应的槽位类型、槽位内容原名、槽位内容别名、槽位内容原名拼音和槽位内容别名拼音,电子设备进行槽位信息校正时,可以确定该槽位信息对应的三元组,并根据该三元组在该槽位索引知识库中查找与该三元组中的至少两项匹配的第一候选槽位信息,采用该第一候选槽位信息对应的第一目标槽位内容对该槽位信息的目标槽位内容进行校正,槽位信息校正的速度快、准确率高、可迁移性强,本申请实施例的槽位信息校正方法具有可靠性、鲁棒性和可泛化性。

    一种槽位识别方法及设备
    3.
    发明公开

    公开(公告)号:CN117521654A

    公开(公告)日:2024-02-06

    申请号:CN202311121789.1

    申请日:2023-08-31

    IPC分类号: G06F40/295

    摘要: 本申请实施例提供了一种槽位识别方法及设备,在本申请实施例中,电子设备通过槽位识别模型进行槽位识别,提高了槽位识别的可靠性和泛化性,并且槽位识别模型在进行槽位识别时,该槽位识别模型确定目标文本中字节的目标字向量、包含目标字节的目标候选实体的目标词向量以及该目标候选实体对应的目标类别向量,增加了目标字节的词语信息和类别信息,从而提升对长实体和嵌套实体的识别效果,提高槽位识别的准确率和可解释性,符合可信赖特性。

    一种基于大语言模型的SQL语句生成方法、装置及设备

    公开(公告)号:CN117271561A

    公开(公告)日:2023-12-22

    申请号:CN202311540773.4

    申请日:2023-11-20

    IPC分类号: G06F16/242

    摘要: 本申请涉及人工智能技术领域,尤其涉及一种基于大语言模型的SQL语句生成方法、装置及设备。由大语言模型确定对待转换文本进行转换的N个转换计划,及每个执行步骤对应的多个候选SQL语句,再基于路径搜索算法确定最优转换计划中的每个执行步骤对应的目标候选SQL语句,也就是说使大语言模型确定多种转换计划,每个转换计划包括至少一个执行步骤,即将待转换文本分解为简单文本,以提高大语言模型处理文本的能力,并生成每个执行步骤的多个候选SQL语句,基于路径搜索算法确定最优候选SQL语句,有效提高了大语言模型生成SQL语句的准确率。本申请所保护的技术方案具有可泛化性、实时性、可控性、可靠性特点,符合可信赖特性。

    一种关键信息提取方法及设备
    5.
    发明公开

    公开(公告)号:CN117010377A

    公开(公告)日:2023-11-07

    申请号:CN202310801619.1

    申请日:2023-06-30

    IPC分类号: G06F40/284 G06F40/295

    摘要: 本申请涉及人工智能技术领域,尤其涉及一种关键信息提取方法及设备。该方法基于命名实体识别算法得到待分析文本的分词序列,将分词序列中的首个分词确定为分隔分词,并确定首个分词之后的分词的目标词性与相邻的前一分词的词性是否相同,若否,确定位于上一分隔分词与该分词之间的其他分词是否存在与目标词性相同的词性,若存在,将该分词确定为分隔分词;根据分隔分词在待分析文本中的第一位置信息得到短句,通过确定短句中包含的分词的词性,对分词分组,并基于分组确定多个关键信息。将待分析文本拆分为短句,从而根据词性确定关键信息,提高了文本关键信息提取的准确率。本申请所保护的技术方案具有可解释性、鲁棒性,符合可信赖特性。

    数据加密方法及电子设备
    7.
    发明公开

    公开(公告)号:CN118282675A

    公开(公告)日:2024-07-02

    申请号:CN202211706632.0

    申请日:2022-12-29

    IPC分类号: H04L9/40 H04L9/00

    摘要: 本公开提供数据加密方法及电子设备。用于提高数据加密的安全性。包括:响应于用户发送的数据加密指令,利用预设的智能优化算法对初始混沌参数进行更新,得到目标混沌参数;基于目标混沌参数,得到混沌序列值;利用混沌序列值对待更新的混沌序列进行更新,得到更新后的混沌序列;若确定更新后的混沌序列的长度小于指定长度,则将更新后的混沌序列确定为待更新的混沌序列和将目标混沌参数确定为初始混沌参数后,返回执行利用预设的智能优化算法对初始混沌参数进行更新,得到目标混沌参数的步骤,直至更新后的混沌序列的长度不小于所述指定长度,则基于更新后的混沌序列对数据加密指令中的目标数据进行加密处理,得到密文。

    基于城市问答系统的领域识别方法及设备

    公开(公告)号:CN116842145B

    公开(公告)日:2024-02-27

    申请号:CN202310426515.7

    申请日:2023-04-20

    摘要: 本申请公开了基于城市问答系统的领域识别方法及设备,预先保存不同用户的身份标识信息与领域的对应关系,在接收目标用户的问答请求信息之后,获取其中携带的目标语言文本信息和目标身份标识信息,然后根据上述对应关系确定出目标身份标识信息对应的目标领域。从用户身份的角度实现领域识别,解决了不同领域之间的语言文本信息十分相似,导致深度学习模型识别领域不准确的问题,提高了领域识别的准确性。当根据目标身份标识信息识别目标领域失败时,基于领域识别模型,通过目标语言文本信息和目标身份标识信息两个维度的信息进行领域识别,提高了领域识别的准确性。本申请所包含的技术方案具有准确率高、推理速度快的特点,符合可信赖性特点。

    基于城市问答系统的领域识别方法及设备

    公开(公告)号:CN116842145A

    公开(公告)日:2023-10-03

    申请号:CN202310426515.7

    申请日:2023-04-20

    摘要: 本申请公开了基于城市问答系统的领域识别方法及设备,预先保存不同用户的身份标识信息与领域的对应关系,在接收目标用户的问答请求信息之后,获取其中携带的目标语言文本信息和目标身份标识信息,然后根据上述对应关系确定出目标身份标识信息对应的目标领域。从用户身份的角度实现领域识别,解决了不同领域之间的语言文本信息十分相似,导致深度学习模型识别领域不准确的问题,提高了领域识别的准确性。当根据目标身份标识信息识别目标领域失败时,基于领域识别模型,通过目标语言文本信息和目标身份标识信息两个维度的信息进行领域识别,提高了领域识别的准确性。本申请所包含的技术方案具有准确率高、推理速度快的特点,符合可信赖性特点。

    一种基于大语言模型的SQL语句生成方法、装置及设备

    公开(公告)号:CN117271561B

    公开(公告)日:2024-03-01

    申请号:CN202311540773.4

    申请日:2023-11-20

    IPC分类号: G06F16/242

    摘要: 本申请涉及人工智能技术领域,尤其涉及一种基于大语言模型的SQL语句生成方法、装置及设备。由大语言模型确定对待转换文本进行转换的N个转换计划,及每个执行步骤对应的多个候选SQL语句,再基于路径搜索算法确定最优转换计划中的每个执行步骤对应的目标候选SQL语句,也就是说使大语言模型确定多种转换计划,每个转换计划包括至少一个执行步骤,即将待转换文本分解为简单文本,以提高大语言模型处理文本的能力,并生成每个执行步骤的多个候选SQL语句,基于路径搜索算法确定最优候选SQL语句,有效提高了大语言模型生成SQL语句的准确率。本申请所保护的技术方案具有可泛化性、实时性、可控性、可靠性特点,符合可信赖特性。