-
公开(公告)号:CN113158659B
公开(公告)日:2024-03-08
申请号:CN202110180660.2
申请日:2021-02-08
申请人: 银江技术股份有限公司
IPC分类号: G06F40/284 , G06F40/289 , G06N3/08 , G06F40/126 , G06F16/35
-
公开(公告)号:CN109543178B
公开(公告)日:2023-02-28
申请号:CN201811294777.8
申请日:2018-11-01
申请人: 银江技术股份有限公司
IPC分类号: G06F40/30 , G06F40/242 , G06F40/216 , G06F40/289 , G06F16/33 , G06Q50/18
摘要: 本申请提供了一种司法文本标签体系构建方法及系统。通过分词工具获取司法词汇文本,根据词频统计构建初级标签体系,对初级标签体系中语义相近的标签进行合并,对生涩的标签进行扩展,获得扩展标签体系,利用文本测试集,统计扩展标签体系搜索文本的准确度,验证当前的扩展标签体系是否构建完成,否则进一步优化标签体系。实现对不同法律构建针对性的标签体系,大大提高了司法文本的搜索精度。
-
公开(公告)号:CN112001162B
公开(公告)日:2024-05-31
申请号:CN202010758053.5
申请日:2020-07-31
申请人: 银江技术股份有限公司
IPC分类号: G06F40/205 , G06F40/284 , G06N3/0455 , G06N3/082 , G06F18/214 , G06F18/22 , G06Q50/18
摘要: 基于小样本学习的智能审判系统,包括相似案件检索模型,用于根据输入的目标案情和推送法条从案件库中检索出若干个相似案件,形成相似案件集输出,所述案件库存储有案件,所述案件包括案情、法条、审判结果;审判要素推理模型,用于根据输入的目标案情在相似案件集的基础上给出审判要素预测。本发明解决案情、法条的一对多和长短文匹配问题,解决数据标注成本高,且模型无法向新增类型扩展及复用的问题,解决案情审判对象无法结构化,审判错误等问题。
-
公开(公告)号:CN112712117B
公开(公告)日:2024-03-26
申请号:CN202011601945.0
申请日:2020-12-30
申请人: 银江技术股份有限公司
IPC分类号: G06V10/764 , G06V10/80 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明涉及一种基于全卷积注意力的多元时间序列分类方法及系统,本发明利用图像领域中全卷积的设计思路,使用2D卷积滤波器捕获多元时间序列局部变量特征以学习相邻变量之间的联动关系,同时使用2D卷积滤波器捕获多元时间序列局部时间特征以学习相邻时间之间的趋势信息,减弱突变信息对结果的影响;采用卷积加自注意力模型,多核卷积获取多种局部特征,自注意力模型计算多种局部特征和非局部特征的权重,提供了不同的视角去审视多元时间序列数据;采用注意力模型分别融合对应视角的变量和时间特征,同时学习到变量的全局依赖关系以及时间的全局依赖关系;采用权重矩阵方法融合多视角的特征,学习更全面更准确的时间变量交互特征。
-
公开(公告)号:CN111159336B
公开(公告)日:2023-09-12
申请号:CN201911324891.5
申请日:2019-12-20
申请人: 银江技术股份有限公司
IPC分类号: G06F16/33 , G06F16/35 , G06F40/295 , G06F40/30 , G06F18/241 , G06N3/0442 , G06N3/048 , G06N3/08
摘要: 一种半监督司法实体及事件联合提取方法,其步骤如下:司法文本分词处理,司法文本数据多特征嵌入,构建司法实体及事件联合提取模型,提取实体、事件和事件属性。本发明基于双向LSTM网络构建司法实体及事件联合提取模型,融合多种特征,有效提高提取准确度;同时模型训练基于数据增广和批量数据混合的半监督模型,极大提升提取模型的可用性。
-
公开(公告)号:CN110442760B
公开(公告)日:2022-02-15
申请号:CN201910672217.X
申请日:2019-07-24
申请人: 银江技术股份有限公司
IPC分类号: G06F16/9032 , G06F16/906 , G06F16/951 , G06F40/247
摘要: 本发明涉及一种问答检索系统的同义词挖掘方法及装置,本发明通过对问答语料分类,按类别进行关键词提取,得到待处理关键词集,同时对垂直领域内的大语料进行词向量训练,并计算词向量的余弦相似度,得到当前类别关键词的广义相关词集合,然后进行词性筛选,得到缩略相关词集,再计算缩略相关词集合内的欧式距离,得到同义词对,并统计同义词对的共现频次,计算同义词的替换概率,最终根据同义词对替换后的检索召回结果,对不满足检索召回阈值的同义词对,进行反馈修正,较好的解决了同义词替换后的语义变形问题,提高了同义词挖掘的准确度以及问答对检索结果的准确性。
-
公开(公告)号:CN111651986B
公开(公告)日:2024-04-02
申请号:CN202010352088.9
申请日:2020-04-28
申请人: 银江技术股份有限公司
IPC分类号: G06F40/289 , G06F40/284 , G06F40/295 , G06F40/205 , G06F40/242
摘要: 本发明公开了一种事件关键词提取方法,涉及自然语言处理技术领域,用于解决现有事件提取不准确的问题,该方法包括以下步骤:获取文本数据及所述文本数据的标注数据;将所述文本数据及所述标注数据以句子形式输入第一BERT模型进行训练,得到句子层关键词;对第二BERT模型进行模型精调,得到文档层关键词;生成事件关系图;根据所述事件关系图筛选出符合预设条件的若干文档层关键词作为事件关键词。本发明还公开了一种事件关键词提取装置、电子设备和计算机存储介质。本发明通过对半监督的方法进行关键词提取,并通过事件关系图实现关键词筛选。
-
公开(公告)号:CN112015894B
公开(公告)日:2024-03-26
申请号:CN202010835617.0
申请日:2020-08-19
申请人: 银江技术股份有限公司
IPC分类号: G06F16/35 , G06F18/2415 , G06F18/214
摘要: 本发明涉及自然语言处理领域,尤其涉及一种基于深度学习的文本单类分类方法及系统,包括文本预处理步骤、构建深度学习特征提取网络步骤、生成单类分类模型步骤、单类分类预测步骤,系统,包括:文本数据获取模块、文本预处理模块、深度学习特征提取网络、单类分类模型、分类预测模块。本发明采用深度学习算法自动提取单类文本的复杂特性,无需根据单类数据特性设计相对应的算法,形成特征工程通用模型,解决了单类分类任务的首要难点,还采用模糊邻域覆盖的隶属关系进行软划分,将数据样本分为正(肯定属于某类),负(肯定不属于某类)和不确定情况,有效处理不确定数据,以降低分类风险。
-
公开(公告)号:CN110059311B
公开(公告)日:2023-04-28
申请号:CN201910237329.2
申请日:2019-03-27
申请人: 银江技术股份有限公司
IPC分类号: G06F40/289 , G06F40/216 , G06F40/242 , G06F16/36 , G06F16/951 , G06Q50/18
摘要: 本发明涉及一种面向司法文本数据的关键词提取方法及系统,本发明首先以引入法律名称和司法相关专业性词汇表用于分词,并且进行人工复检来构建司法专业词汇标注表;然后通过将构建司法专业词汇标注词典和大规模的用户词典,进行分词,去除停用词等方法,获取词语;并且采集统计各类纠纷与案由的关键词搜索词汇,共同组成候选关键词;其次,加入标题词权重和词语全局性权重值方法修正候选关键词TF_IDF的权值,如果待提取的文档中未含有候选关键词,那么采用文档中每个词的TF_IDF归一化值作为TextRank算法初始权值输入,得到最终的词语权值。本发明可以较好地匹配司法文本数据,匹配性高,适用于大部分的司法文本数据;并且加快了提取速度,同时提取准确度高。
-
公开(公告)号:CN111159763B
公开(公告)日:2022-05-31
申请号:CN201911366166.4
申请日:2019-12-26
申请人: 银江技术股份有限公司
摘要: 本发明涉及一种涉法人员群体画像分析系统及方法,本发明主要包括涉法数据融合及预处理,涉法数据深度脱敏,融合数据特征处理,涉法人员群体挖掘,群体画像构建和画像展示六部分;本发明针对司法数据进行深度脱敏,防止信息泄露保护信息安全,并且针对融合多种业务系统涉法人员的群体性画像,方便挖掘特殊群体并进行有针对性的策略制定;此外,本发明还具有一定的灵活性,可根据用户经验对画像特征进行调整,并且可以针对特殊群体进行可视化展示。
-
-
-
-
-
-
-
-
-