模型建立方法及系统及段落标签获得方法及介质
摘要:
本发明公开了模型建立方法及系统及段落标签获得方法及介质,涉及自然语言处理迁移学习领域,包括:从数据库中收集所有的裁判文书数据获得预训练数据;定义不同类型裁判文书的段落标签;标记不同类型的裁判文书的段落标签,得到训练数据;构建裁判文书结构化模型;预训练模型;利用训练数据训练预训练后的裁判文书结构化模型;调试训练后的裁判文书结构化模型,得到最终的裁判文书结构化模型;其中,裁判文书结构化模型的输入为裁判文书文本数据,且该输入裁判文书的段落添加有任务前缀,裁判文书结构化模型的输出为裁判文书的段落标签文本数据;通过本方法建立的模型在训练后可以对任意类型的裁判文书段落标签进行预测。
0/0