-
公开(公告)号:CN117933246A
公开(公告)日:2024-04-26
申请号:CN202311660326.2
申请日:2023-12-05
申请人: 中国电子科技集团公司第十五研究所 , 中电科大数据研究院有限公司
IPC分类号: G06F40/289 , G06F40/126 , G06F16/35 , G06Q50/18 , G06Q10/10 , G06Q10/04 , G06N5/025 , G06N3/0442
摘要: 本发明公开了一种基于已获取证据和现场信息的取证指引方法及装置,所述方法包括:确定当前案件已有线索;获取所述案件的证据要素,建立所述证据要素与证据证实的事实的关联对,将所述关联对输入训练完毕的神经网络模型,对所述案件涉嫌的罪名进行预测;为所述现场信息添加信息标签,所述信息标签用于表征需要针对性进行取证的案件必要信息;梳理取证指引规则,基于信息标签从历史案件数据库中获取同类历史案件,基于所述同类历史案件,生成取证内容建议;基于所述当前案件已有线索、预测的罪名、取证指引规则及取证内容建议,生成取证指引信息。本方法预测结果较为全面,预测结果更加准确。
-
公开(公告)号:CN113220850B
公开(公告)日:2024-06-11
申请号:CN202110451235.2
申请日:2021-04-26
申请人: 中国电子科技集团公司第十五研究所
IPC分类号: G06F16/332 , G06F16/33 , G06F40/295
摘要: 本发明公开了一种面向庭审阅卷的案件画像挖掘方法,使用基于规则的方法和基于统计学习的自然语言处理想结合的方法来提取案件画像信息,首先会获取大量真实案件的卷宗并对卷宗文件进行预处理,然后根据宪法、刑法等法律相关知识构建出需要提取的信息也即空的案件画像树,之后基于提炼的规则和模型提取画像树所需要的信息,仅仅需要少量有标注数据就可以进行训练,最后根据提取的信息生成完整的案件画像树,可以实现计算机自动化的阅卷,将卷宗信息提取出来方便法官快速的了解案件信息和后续自动化判案。
-
公开(公告)号:CN118364822A
公开(公告)日:2024-07-19
申请号:CN202410776086.0
申请日:2024-06-17
申请人: 中国电子科技集团公司第十五研究所
IPC分类号: G06F40/295 , G06F18/2415 , G06F18/2431 , G06N3/047 , G06N3/08
摘要: 本发明提供了一种基于原型网络的嵌套命名实体识别方法和装置,属于自然语言处理技术领域。本发明方法采用原型网络作为识别结构;构建训练样本时,根据训练文本序列中每个字符在已知实体中的位置和实体类型,构成标签;一个字符可能对应多个标签,形成理想标签组,组成训练样本,对原型网络进行训练;进行识别时,将待识别文本序列输入原型网络,生成每个字符对应的标签组;待识别文本所有字符的标签组组成标签序列,最后对标签序列进行标签解析,识别出实体。使用本发明能够能够有效支撑多类别嵌套实体的识别。
-
公开(公告)号:CN117436407A
公开(公告)日:2024-01-23
申请号:CN202311079493.8
申请日:2023-08-25
申请人: 中国电子科技集团公司第十五研究所
IPC分类号: G06F40/126 , G06F40/289 , G06N3/045
摘要: 一种基于分组编码的长文本推理方法,具体步骤包括:根据文本长度和预训练模型可接受的句子最大字符数计算分组长度;根据计算的分组长度,对分词后的句子进行分组;对分组后的每组字符进行编号,其中,每组内的字符采用相同编号;根据编号自动选取位置向量。本公开通过分组编码突破预训练模型文本长度限制,同时可以使得经预训练模型计算后的隐层向量获得文本的全局信息,适用于任何自然语言处理任务。
-
公开(公告)号:CN113220850A
公开(公告)日:2021-08-06
申请号:CN202110451235.2
申请日:2021-04-26
申请人: 中国电子科技集团公司第十五研究所
IPC分类号: G06F16/332 , G06F16/33 , G06F40/295
摘要: 本发明公开了一种面向庭审阅卷的案件画像挖掘方法,使用基于规则的方法和基于统计学习的自然语言处理想结合的方法来提取案件画像信息,首先会获取大量真实案件的卷宗并对卷宗文件进行预处理,然后根据宪法、刑法等法律相关知识构建出需要提取的信息也即空的案件画像树,之后基于提炼的规则和模型提取画像树所需要的信息,仅仅需要少量有标注数据就可以进行训练,最后根据提取的信息生成完整的案件画像树,可以实现计算机自动化的阅卷,将卷宗信息提取出来方便法官快速的了解案件信息和后续自动化判案。
-
-
-
-