一种结合LLM和BERT的NL2SQL方法及系统

    公开(公告)号:CN118296034A

    公开(公告)日:2024-07-05

    申请号:CN202410497713.7

    申请日:2024-04-24

    IPC分类号: G06F16/242 G06N3/045 G06N3/08

    摘要: 本发明涉及一种结合LLM和BERT的NL2SQL方法及系统,该方法步骤包括:获取自然语言与表字段输入;将自然语言与表字段分别输入多个基于BERT的预测模型,并分别预测不同的数据库语言关键信息;基于预测模型的预测结果以及数据库的表信息,完成SQL语句的组装并提取目标数据集;构建Prompt指令,通过LLM提取自然语言的真实意图;将目标数据集以及真实的意图作为LLM的上下文语义,通过Prompt指令提取最终用户预期的结果集。与现有技术相比,本发明具备更好的泛化能力,并且引入LLM的理解能力,能更好的理解搜索条件的真实意图,大大提升了SQL语句生成的准确性,更好地帮助NL2SQL在实际中应用。

    一种融合大规模语言模型的电力行业知识图谱构建方法

    公开(公告)号:CN118627604A

    公开(公告)日:2024-09-10

    申请号:CN202410675721.6

    申请日:2024-05-29

    摘要: 本发明公开一种融合大规模语言模型的电力行业知识图谱构建方法,基于大模型的提示工程迭代式地自动构建电力行业知识图谱,属于计算机自然语言处理领域,方法包括:首先,输入电力行业相关文本,设计提示模版自动化识别文本中相关的实体和类型;然后,设计检索模型会从知识库、数据库或外部来源抓取文本相关信息辅助文本的关系抽取;接着在识别到的关系、实体和类型的基础上,识别相关的三元组;从大模型自动生成相关的电力领域的三元组;最后,设计提示模版自动化地消解识别到的实体、谓词。本发明有助于解决电力行业的领域知识库自动构建的难题。