发明公开
- 专利标题: 模型建立方法及系统及段落标签获得方法及介质
-
申请号: CN202011605780.4申请日: 2020-12-30
-
公开(公告)号: CN112699218A公开(公告)日: 2021-04-23
- 发明人: 翁洋 , 李鑫 , 王竹 , 其他发明人请求不公开姓名
- 申请人: 成都数之联科技有限公司
- 申请人地址: 四川省成都市武侯区一环路西一段菊乐路口1栋4层2号
- 专利权人: 成都数之联科技有限公司
- 当前专利权人: 成都数之联科技有限公司
- 当前专利权人地址: 四川省成都市武侯区一环路西一段菊乐路口1栋4层2号
- 代理机构: 成都云纵知识产权代理事务所
- 代理商 熊曦; 陈婉鹃
- 主分类号: G06F16/33
- IPC分类号: G06F16/33 ; G06F16/35 ; G06F40/126 ; G06F40/151 ; G06F40/279 ; G06F40/30
摘要:
本发明公开了模型建立方法及系统及段落标签获得方法及介质,涉及自然语言处理迁移学习领域,包括:从数据库中收集所有的裁判文书数据获得预训练数据;定义不同类型裁判文书的段落标签;标记不同类型的裁判文书的段落标签,得到训练数据;构建裁判文书结构化模型;预训练模型;利用训练数据训练预训练后的裁判文书结构化模型;调试训练后的裁判文书结构化模型,得到最终的裁判文书结构化模型;其中,裁判文书结构化模型的输入为裁判文书文本数据,且该输入裁判文书的段落添加有任务前缀,裁判文书结构化模型的输出为裁判文书的段落标签文本数据;通过本方法建立的模型在训练后可以对任意类型的裁判文书段落标签进行预测。