模型建立方法及系统及段落标签获得方法及介质

发明公开

CN112699218A 模型建立方法及系统及段落标签获得方法及介质审中-实审

请登陆查看更多内容

专利标题： 模型建立方法及系统及段落标签获得方法及介质
申请号： CN202011605780.4

申请日： 2020-12-30
公开(公告)号： CN112699218A

公开(公告)日： 2021-04-23
发明人: 翁洋 , 李鑫 , 王竹 , 其他发明人请求不公开姓名
申请人： 成都数之联科技有限公司
申请人地址： 四川省成都市武侯区一环路西一段菊乐路口1栋4层2号
专利权人： 成都数之联科技有限公司
当前专利权人： 成都数之联科技有限公司
当前专利权人地址： 四川省成都市武侯区一环路西一段菊乐路口1栋4层2号
代理机构： 成都云纵知识产权代理事务所
代理商 熊曦; 陈婉鹃
主分类号： G06F16/33
IPC分类号： G06F16/33 ; G06F16/35 ; G06F40/126 ; G06F40/151 ; G06F40/279 ; G06F40/30

摘要：

本发明公开了模型建立方法及系统及段落标签获得方法及介质，涉及自然语言处理迁移学习领域，包括：从数据库中收集所有的裁判文书数据获得预训练数据；定义不同类型裁判文书的段落标签；标记不同类型的裁判文书的段落标签，得到训练数据；构建裁判文书结构化模型；预训练模型；利用训练数据训练预训练后的裁判文书结构化模型；调试训练后的裁判文书结构化模型，得到最终的裁判文书结构化模型；其中，裁判文书结构化模型的输入为裁判文书文本数据，且该输入裁判文书的段落添加有任务前缀，裁判文书结构化模型的输出为裁判文书的段落标签文本数据；通过本方法建立的模型在训练后可以对任意类型的裁判文书段落标签进行预测。

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06F	电数字数据处理（基于特定计算模型的计算机系统入G06N）
G06F16/00	信息检索；数据库结构；文件系统结构
G06F16/30	.•非结构文本数据（文档管理系统入G06F 16/93）
G06F16/33	..••查询