一种基于大模型的网络安全问答方法及系统

    公开(公告)号:CN118964581A

    公开(公告)日:2024-11-15

    申请号:CN202411159160.0

    申请日:2024-08-22

    摘要: 本申请公开了一种基于大模型的网络安全问答方法及系统,所述方法包括:获取用户输入的网络安全问题;将网络安全问题输入预先训练好的大模型中,由大模型基于目标网络安全知识库,分析得到网络安全问题的答案;其中,先利用无监督训练数据集对大模型进行继续预训练,再基于监督微调策略,利用有监督训练数据集对大模型进行二次迭代训练,最后基于人类反馈强化学习策略,将大模型与训练好的奖励模型相结合,对大模型进行第三次迭代训练,得到训练好的大模型;奖励模型利用标注数据集训练得到;标注数据集通过对大模型输出的结果进行优劣标注得到;无监督训练数据集由多个数据源的网络安全数据组成;将网络安全问题的答案反馈给用户。