基于深度学习的法律文件自动分类方法及系统
摘要:
本发明提供一种基于深度学习的法律文件自动分类方法及系统,该方法包括如下步骤:基于预设的文件模板预处理所有法律文件;将预处理后的所有法律文件分别进行分词处理,得到多个分词集合;通过预设的核心词汇库提取所有分词集合中的核心关键词;筛选出目标核心关键词;根据目标核心关键词将所有分词集合划分为多个核心分词集合簇和边缘分词集合簇;统计其他分词的分词词频;利用深度聚类算法并根据分词词频分别对多个核心分词集合簇进行重复二分聚类;采用语义分析提取出所有核心分词集合簇的簇主题;基于簇主题并利用主题模型算法将边缘分词集合簇中的分词集合归纳至各个核心分词集合簇中。本发明具有快速完成法律文件自动分类的效果。
公开/授权文献
0/0