大型语言模型的代码生成优化方法、装置、设备及介质

    公开(公告)号:CN117724695A

    公开(公告)日:2024-03-19

    申请号:CN202410179354.0

    申请日:2024-02-18

    摘要: 本申请公开了一种大型语言模型的代码生成优化方法、装置、设备及介质,涉及计算机技术领域,该方法包括:生成当前代码片段的语义表示,并获取所述当前代码片段的错误信息;获取目标策略网络基于所述语义表示和所述错误信息输出的与所述当前代码片段对应的修复建议和调试策略;将所述修复建议和所述调试策略输入至目标错误消息生成模型,以得到所述目标错误消息生成模型输出的与所述当前代码片段对应的错误消息;利用所述当前代码片段、所述修复建议、所述调试策略以及所述错误消息对大型语言模型中与代码生成优化相关的参数进行更新,得到优化后大型语言模型。通过上述方案,能够提升大型语言模型的代码生成能力及其自动化代码调试能力。

    大语言模型的提示词确定方法、装置、设备及介质

    公开(公告)号:CN117744753A

    公开(公告)日:2024-03-22

    申请号:CN202410182475.0

    申请日:2024-02-19

    IPC分类号: G06N3/092 G06N5/04 G06F18/214

    摘要: 本申请公开了一种大语言模型的提示词确定方法、装置、设备及介质,涉及计算机技术领域,包括:利用强化学习算法对初始大语言模型进行训练,以得到目标大语言模型;从当前提示词集合中选择当前提示词,将当前提示词确定为当前动作;将当前动作和当前测试样本输入至目标大语言模型,以便目标大语言模型生成当前测试结果;根据当前测试结果及其准确性得分对当前提示词集合进行调整,得到下一提示词集合,基于准确性得分从下一提示词集合中选择下一提示词,以进行下一轮的提示词准确性得分确定,直至满足预设停止测试条件,以确定目标大语言模型的目标提示词集合。通过上述方案,能够确定出准确的提示词以提升大语言模型的推理能力。

    大语言模型的提示词确定方法、装置、设备及介质

    公开(公告)号:CN117744753B

    公开(公告)日:2024-05-03

    申请号:CN202410182475.0

    申请日:2024-02-19

    IPC分类号: G06N3/092 G06N5/04 G06F18/214

    摘要: 本申请公开了一种大语言模型的提示词确定方法、装置、设备及介质,涉及计算机技术领域,包括:利用强化学习算法对初始大语言模型进行训练,以得到目标大语言模型;从当前提示词集合中选择当前提示词,将当前提示词确定为当前动作;将当前动作和当前测试样本输入至目标大语言模型,以便目标大语言模型生成当前测试结果;根据当前测试结果及其准确性得分对当前提示词集合进行调整,得到下一提示词集合,基于准确性得分从下一提示词集合中选择下一提示词,以进行下一轮的提示词准确性得分确定,直至满足预设停止测试条件,以确定目标大语言模型的目标提示词集合。通过上述方案,能够确定出准确的提示词以提升大语言模型的推理能力。

    大型语言模型的代码生成优化方法、装置、设备及介质

    公开(公告)号:CN117724695B

    公开(公告)日:2024-04-30

    申请号:CN202410179354.0

    申请日:2024-02-18

    摘要: 本申请公开了一种大型语言模型的代码生成优化方法、装置、设备及介质,涉及计算机技术领域,该方法包括:生成当前代码片段的语义表示,并获取所述当前代码片段的错误信息;获取目标策略网络基于所述语义表示和所述错误信息输出的与所述当前代码片段对应的修复建议和调试策略;将所述修复建议和所述调试策略输入至目标错误消息生成模型,以得到所述目标错误消息生成模型输出的与所述当前代码片段对应的错误消息;利用所述当前代码片段、所述修复建议、所述调试策略以及所述错误消息对大型语言模型中与代码生成优化相关的参数进行更新,得到优化后大型语言模型。通过上述方案,能够提升大型语言模型的代码生成能力及其自动化代码调试能力。

    一种思维链推理方法、装置、设备及存储介质

    公开(公告)号:CN117216219A

    公开(公告)日:2023-12-12

    申请号:CN202311238998.4

    申请日:2023-09-22

    发明人: 王强 陈康明

    摘要: 本发明公开了一种思维链推理方法、装置、设备及存储介质,涉及计算机技术领域,应用于机器人对话系统,包括:对获取到的用户输入的原始语言文本、画面信息和目标常识知识进行特征提取得到第一文本特征、视觉特征以及常识知识特征;将基于第一文本特征、视觉特征以及常识知识特征确定的第一输入内容输入至大语言模型中得到思维链原理;对根据思维链原理和原始语言文本确定的目标语言文本进行特征提取得到第二文本特征;将基于第二文本特征、视觉特征以及常识知识特征确定的第二输入内容输入至大语言模型中得到大语言模型推理输出的推理回答内容。本发明通过引入视觉特征和常识知识特征进行思维链的推理,能够提升大语言模型的推理能力。