基于知识图谱的案件信息语义检索方法及装置

    公开(公告)号:CN111475623B

    公开(公告)日:2023-08-22

    申请号:CN202010273401.X

    申请日:2020-04-09

    Abstract: 本申请涉及一种基于知识图谱的案件信息语义检索方法及装置,基于知识图谱的案件信息语义检索方法包括根据法律文书构建法治知识图谱;对用户输入的问题进行简单识别和意图识别;定义sparql语言查询模板,根据意图识别结果匹配相应sparql语言查询模板在法治知识图谱中进行第一检索,为第一检索结果赋予第一置信度;搭建全文搜索引擎,将简单识别结果在全文搜索引擎中进行第二检索,为第二检索结果赋予第二置信度;根据第一置信度和所述第二置信度输出最终检索结果。本申请可以充分挖掘实体之间的联系,完成复杂的多跳语义检索,即使法治知识图谱的语义检索出现不能满足要求的输出时也可以基于全文搜索引擎返回检索结果,进一步提高检索效率和准确性。

    基于LSTM网络的法条语义标注方法及装置

    公开(公告)号:CN111460834B

    公开(公告)日:2023-06-06

    申请号:CN202010273691.8

    申请日:2020-04-09

    Abstract: 本发明涉及一种基于LSTM网络的法条语义标注方法及装置,包括获取待分析文本;对待分析文本进行分析处理,以获取待分析文本的所有单词和单词对应的词性标注,转化为D维词向量输入到全连接神经网络中获取特征编码;将待分析文本的词性标注与预设数据库中文本的词性标注进行对比获取最匹配文本,获取最终向量表示;将最终向量表示输入全连接神经网络,输出待分析文本中每个单词的语义角色标注;本发明可以自动分析法律法条中的施事者、受事者、时间、地点等要素,能够辅助相关人员理解法条语义,并为更高层的法律信息化应用提供支持,可以有效提高工作人员的工作效率。

    一种生成文本摘要的方法、装置及存储介质

    公开(公告)号:CN114860873A

    公开(公告)日:2022-08-05

    申请号:CN202210424334.6

    申请日:2022-04-22

    Abstract: 本申请一些实施例提供了一种生成文本摘要的方法、装置及存储介质,涉及信息处理技术领域,该方法包括对初始文本进行分块处理,获取处理后的文本数据;将所述文本数据输入到目标摘要生成模型,获取目标摘要,其中,所述目标摘要生成模型包括第一目标文本模型和第二目标文本模型,所述第一目标文本模型是通过训练第一文本模型得到的,所述第二目标文本模型是通过训练第二文本模型得到的,所述第一目标文本模型用于提取所述文本数据包括的目标信息,所述第二目标文本模型用于根据所述目标信息生成所述目标摘要。本申请一些实施例可以对文本进行准确地信息提取,生成质量较高的文本摘要,且解决了文本信息丢失的问题。

    一种获得数据补全模型、数据补全的方法、装置及介质

    公开(公告)号:CN114756727A

    公开(公告)日:2022-07-15

    申请号:CN202210459090.5

    申请日:2022-04-27

    Abstract: 本申请实施例提供一种获得数据补全模型、数据补全的方法、装置及介质,该方法包括:通过所述编码器将所述样本数据进行编码,获得样本编码数据,其中,所述样本数据包括缺失数据以及与所述缺失数据相对应的完整数据;将所述样本编码数据输入到所述生成对抗网络中,获得生成数据;通过所述解码器对所述生成数据进行解码获得补全数据,并且计算所述样本数据与所述补全数据之间的损失函数值;基于所述损失函数值调整所述编码器和所述解码器的参数;重复上述过程,直至所述损失函数值满足预设条件,获得目标数据补全模型。通过本申请的一些实施例能够提升数据补全模型的性能,从而能够提升数据补全的准确率。

    一种识别信访件的方法和装置

    公开(公告)号:CN114550194A

    公开(公告)日:2022-05-27

    申请号:CN202210441221.7

    申请日:2022-04-26

    Abstract: 本申请实施例提供一种识别信访件的方法和装置,该方法包括:获取待识别信访件;对待识别信访件进行格式转换,得到待识别信访件的图像;对待识别信访件的图像中的指定内容进行识别,得到识别结果;其中,指定内容包括红头标题、文号、日期、公章和手写签名中的至少一个内容。借助于上述技术方案,本申请实施例能够减轻信访工作人员工作量与压力,提升信访件处理效率。

    一种对信访件要素信息的抽取结果评价的方法及装置

    公开(公告)号:CN114528409A

    公开(公告)日:2022-05-24

    申请号:CN202210401206.X

    申请日:2022-04-18

    Abstract: 本申请提供一种对信访件要素信息的抽取结果评价的方法及装置,该方法包括,获取机器抽取信访件要素信息的第一要素集合和人工抽取信访件要素信息的第二要素集合;将第二要素集合中的每一要素信息和第一要素集合中对应的每一要素信息进行匹配,得到第二要素集合中每一要素信息的评分;基于第二要素集合中每一要素信息的评分,确定人工抽取信访件要素信息的评价结果。通过本申请的方法可以达到准确的对人工抽取信访件的要素信息进行评价的效果。

    软件源代码缺陷检测方法、系统、电子设备及储存介质

    公开(公告)号:CN113641586A

    公开(公告)日:2021-11-12

    申请号:CN202110958006.X

    申请日:2021-08-20

    Abstract: 发明实施例涉及软件测试领域,公开了一种软件源代码缺陷检测方法、系统、电子设备及计算机可读存储介质,其中方法包括步骤:构建源代码缺陷数据集,基于开源项目缺陷信息构建用于训练的大规模数据集,包括对开源项目存在的缺陷条目进行自动对齐与抽取以及对所述开源项目源代码缺陷进行上下文增广;构建基于代码切片的深度学习源代码缺陷检测模型,包括使用多模态的语义表示对代码片段进行表示与分类;对基于人工智能的源代码缺陷检测结果集成显示;开发者可以使用本发明所述的方法自动构建来源于真实项目的缺陷数据集并借助模型进行自动判断,而不必花费大量的时间与精力人工遍历代码。

    一种缺陷检测方法、装置以及存储介质

    公开(公告)号:CN112579477A

    公开(公告)日:2021-03-30

    申请号:CN202110213108.9

    申请日:2021-02-26

    Abstract: 本发明实施例涉及软件测试领域,公开了一种缺陷检测方法,包括:S101,构建源代码缺陷数据集,基于开源项目缺陷信息和源代码缺陷报告构建用于训练的大规模数据集,包括对开源项目存在的缺陷条目的抽取以及对所述开源项目源代码缺陷使用静态分析工具进行检测;S102,构建基于缺陷报告的深度学习源代码缺陷检测模型,包括使用多模态的语义表示对代码片段进行表示与分类;S103,对基于人工智能的源代码缺陷检测结果集成显示;开发者可以使用本发明所述的方法对传统源代码分析工具的检测结果进行自动判断,而不必花费大量的时间与经历人工遍历代码。

    代码相似性检测方法、装置以及存储介质

    公开(公告)号:CN112579155A

    公开(公告)日:2021-03-30

    申请号:CN202110198641.2

    申请日:2021-02-23

    Abstract: 本发明实施例涉及软件检测领域,公开了一种代码相似性检测方法,主要分为三个阶段,预处理阶段对海量源代码文件进行预处理和特征提取工作,输出相似哈希指纹值;指纹索引阶段则根据上一阶段的结果,采用分段索引策略将指纹切分并重组后存入相似哈希指纹库,建立分段索引便于快速匹配;相似匹配阶段则在对待测工程文件进行处理后生成相似哈希值,根据所述待测工程文件的相似哈希值从所述相似哈希指纹库中分段检索出溯源检测的结果;本发明能够从不同语言常见行的消除这一角度出发来降低行覆盖问题对结果的影响。

Patent Agency Ranking