- 专利标题: 基于深度学习的法律文件自动分类方法及系统
-
申请号: CN202410258416.7申请日: 2024-03-07
-
公开(公告)号: CN117851602A公开(公告)日: 2024-04-09
- 发明人: 胡智慧 , 孙莉莉 , 叶文鹏 , 李微
- 申请人: 武汉百智诚远科技有限公司
- 申请人地址: 湖北省武汉市东湖新技术开发区关南园一路20号当代科技阅(华夏创业中心)高层办公楼7号楼403号
- 专利权人: 武汉百智诚远科技有限公司
- 当前专利权人: 武汉百智诚远科技有限公司
- 当前专利权人地址: 湖北省武汉市东湖新技术开发区关南园一路20号当代科技阅(华夏创业中心)高层办公楼7号楼403号
- 代理机构: 武汉维卓中知专利代理事务所
- 代理商 屈科辉
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F40/284 ; G06F40/216 ; G06Q50/18
摘要:
本发明提供一种基于深度学习的法律文件自动分类方法及系统,该方法包括如下步骤:基于预设的文件模板预处理所有法律文件;将预处理后的所有法律文件分别进行分词处理,得到多个分词集合;通过预设的核心词汇库提取所有分词集合中的核心关键词;筛选出目标核心关键词;根据目标核心关键词将所有分词集合划分为多个核心分词集合簇和边缘分词集合簇;统计其他分词的分词词频;利用深度聚类算法并根据分词词频分别对多个核心分词集合簇进行重复二分聚类;采用语义分析提取出所有核心分词集合簇的簇主题;基于簇主题并利用主题模型算法将边缘分词集合簇中的分词集合归纳至各个核心分词集合簇中。本发明具有快速完成法律文件自动分类的效果。
公开/授权文献
- CN117851602B 基于深度学习的法律文件自动分类方法及系统 公开/授权日:2024-05-14