一种基于原型网络的嵌套命名实体识别方法和装置

    公开(公告)号:CN118364822A

    公开(公告)日:2024-07-19

    申请号:CN202410776086.0

    申请日:2024-06-17

    摘要: 本发明提供了一种基于原型网络的嵌套命名实体识别方法和装置,属于自然语言处理技术领域。本发明方法采用原型网络作为识别结构;构建训练样本时,根据训练文本序列中每个字符在已知实体中的位置和实体类型,构成标签;一个字符可能对应多个标签,形成理想标签组,组成训练样本,对原型网络进行训练;进行识别时,将待识别文本序列输入原型网络,生成每个字符对应的标签组;待识别文本所有字符的标签组组成标签序列,最后对标签序列进行标签解析,识别出实体。使用本发明能够能够有效支撑多类别嵌套实体的识别。

    一种基于分组编码的长文本处理方法

    公开(公告)号:CN117436407A

    公开(公告)日:2024-01-23

    申请号:CN202311079493.8

    申请日:2023-08-25

    摘要: 一种基于分组编码的长文本推理方法,具体步骤包括:根据文本长度和预训练模型可接受的句子最大字符数计算分组长度;根据计算的分组长度,对分词后的句子进行分组;对分组后的每组字符进行编号,其中,每组内的字符采用相同编号;根据编号自动选取位置向量。本公开通过分组编码突破预训练模型文本长度限制,同时可以使得经预训练模型计算后的隐层向量获得文本的全局信息,适用于任何自然语言处理任务。

    一种小样本条件下的卫星影像舰船型号识别方法

    公开(公告)号:CN112712049B

    公开(公告)日:2023-01-17

    申请号:CN202110031879.6

    申请日:2021-01-11

    摘要: 本发明公开了一种小样本条件下的卫星影像舰船型号识别方法,包括:获取目标区域待识别的舰船遥感图像,并进行预处理;将经预处理后的舰船遥感图像输入训练后的一个少样本学习分类器和C个SVM分类器;通过集成策略,输出多模型融合的所述舰船遥感图像对应的舰船型号。其中,该一个少样本学习分类器和C个SVM分类器,基于度量学习技术,使用度量学习来衡量待识别影像与小样本支持集中不同类别目标间的距离信息,提升小样本条件下数据特征的抽取和表达能力,提高小样本条件下目标识别的精度。另一方面,采用集成学习方法,结合经典的机器学习技术,设计集成策略,实现小样本条件下的舰船目标型号稳定识别,具备多种舰船目标型号识别能力。

    一种面向庭审阅卷的案件画像挖掘方法

    公开(公告)号:CN113220850B

    公开(公告)日:2024-06-11

    申请号:CN202110451235.2

    申请日:2021-04-26

    摘要: 本发明公开了一种面向庭审阅卷的案件画像挖掘方法,使用基于规则的方法和基于统计学习的自然语言处理想结合的方法来提取案件画像信息,首先会获取大量真实案件的卷宗并对卷宗文件进行预处理,然后根据宪法、刑法等法律相关知识构建出需要提取的信息也即空的案件画像树,之后基于提炼的规则和模型提取画像树所需要的信息,仅仅需要少量有标注数据就可以进行训练,最后根据提取的信息生成完整的案件画像树,可以实现计算机自动化的阅卷,将卷宗信息提取出来方便法官快速的了解案件信息和后续自动化判案。

    基于通道重排的轻量级目标检测模型及目标检测方法

    公开(公告)号:CN110705588B

    公开(公告)日:2023-10-17

    申请号:CN201910814115.7

    申请日:2019-08-30

    IPC分类号: G06V10/82 G06N3/0464 G06N3/08

    摘要: 本发明公开了一种基于通道重排的轻量级目标检测模型及目标检测方法。所述模型包括:第一运算单元,用于对输入图像执行至少一次卷积运算,并输出第一图像数据;第二运算单元,用于将第一图像数据分为第一组图像数据和第二组图像数据,并对第一组图像数据执行池化运算,对第二组图像数据执行至少一次卷积运算,并输出第二图像数据;通道重排单元,用于对第二图像数据进行通道重排,输出第三图像数据;第三运算单元,用于将第三图像数据分为第三组图像数据和第四组图像数据,并对第三组图像数据执行至少一次卷积运算后与第四组图像数据张量拼接,输出第四图像数据;第四运算单元,用于对第四图像数据执行至少一次卷积运算,输出第五图像数据。

    一种面向庭审阅卷的案件画像挖掘方法

    公开(公告)号:CN113220850A

    公开(公告)日:2021-08-06

    申请号:CN202110451235.2

    申请日:2021-04-26

    摘要: 本发明公开了一种面向庭审阅卷的案件画像挖掘方法,使用基于规则的方法和基于统计学习的自然语言处理想结合的方法来提取案件画像信息,首先会获取大量真实案件的卷宗并对卷宗文件进行预处理,然后根据宪法、刑法等法律相关知识构建出需要提取的信息也即空的案件画像树,之后基于提炼的规则和模型提取画像树所需要的信息,仅仅需要少量有标注数据就可以进行训练,最后根据提取的信息生成完整的案件画像树,可以实现计算机自动化的阅卷,将卷宗信息提取出来方便法官快速的了解案件信息和后续自动化判案。