发明公开
- 专利标题: 一种用于法律判决文书的长文本生成式摘要方法
-
申请号: CN202410081176.8申请日: 2024-01-19
-
公开(公告)号: CN117891936A公开(公告)日: 2024-04-16
- 发明人: 邓珍荣 , 陈自 , 杨睿 , 蓝如师
- 申请人: 桂林电子科技大学
- 申请人地址: 广西壮族自治区桂林市七星区金鸡路1号
- 专利权人: 桂林电子科技大学
- 当前专利权人: 桂林电子科技大学
- 当前专利权人地址: 广西壮族自治区桂林市七星区金鸡路1号
- 代理机构: 桂林市华杰专利商标事务所有限责任公司
- 代理商 杨雪梅
- 主分类号: G06F16/34
- IPC分类号: G06F16/34 ; G06F40/151 ; G06F40/126 ; G06F40/117 ; G06F40/289 ; G06F40/216 ; G06Q50/18 ; G06N3/0455 ; G06N3/0464
摘要:
本发明公开了一种用于法律判决文书的长文本生成式摘要方法,首先,对原始法律判决文书数据集进行语料转换;其次,将转换过的文本输入到RoBERTa模型中进行处理,使用编码器对文本进行法律文本摘要特征提取;最后,利用UniLM的seq2seqLM,生成法律判决文书的精炼摘要。为了克服模型解码时无法生成表中未包含字词的问题,引入了复制机制。同时为解决生成判决文本摘要中的重复性,采用了覆盖机制。这一创新方法为法律领域的文书摘要生成提供了高效、准确的解决方案。本发明方法能够自动生成法律判决文书摘要,具备简便易用的特点,减少了对人工干预的需求,其高度应用性使其在判决文书处理、文案处理等领域展现出广泛的适用性。