一种基于大模型的网络安全问答方法及系统
摘要:
本申请公开了一种基于大模型的网络安全问答方法及系统,所述方法包括:获取用户输入的网络安全问题;将网络安全问题输入预先训练好的大模型中,由大模型基于目标网络安全知识库,分析得到网络安全问题的答案;其中,先利用无监督训练数据集对大模型进行继续预训练,再基于监督微调策略,利用有监督训练数据集对大模型进行二次迭代训练,最后基于人类反馈强化学习策略,将大模型与训练好的奖励模型相结合,对大模型进行第三次迭代训练,得到训练好的大模型;奖励模型利用标注数据集训练得到;标注数据集通过对大模型输出的结果进行优劣标注得到;无监督训练数据集由多个数据源的网络安全数据组成;将网络安全问题的答案反馈给用户。
0/0