-
公开(公告)号:CN117407536A
公开(公告)日:2024-01-16
申请号:CN202311382276.6
申请日:2023-10-24
Applicant: 之江实验室
Abstract: 本申请涉及一种审计项目适用制度的筛选方法及装置,所述方法包括:基于获取的多个制度文本的制度配置信息,生成哈希表,所述制度配置信息包括制度文本的制度名称、生效日期和存储路径;对所述多个制度文本的制度名称进行聚类,获取至少一个制度序列,每个制度序列包括至少一个制度文本;基于各所述制度序列和对应的制度版本信息,生成制度要点图谱,所述制度版本信息基于所述哈希表中所述制度序列对应的各制度文本的生效日期获取;基于所述审计项目的审计时间范围,对所述制度要点图谱中各所述制度序列对应的制度版本信息进行筛选,得到所述审计项目适用的制度版本,实现随审计时间变换的图谱筛选和展示,提高了审计效率。
-
公开(公告)号:CN116306657A
公开(公告)日:2023-06-23
申请号:CN202310565366.2
申请日:2023-05-19
Applicant: 之江实验室
IPC: G06F40/295 , G06F16/33 , G06N20/00 , G06F16/35
Abstract: 本发明公开一种基于方阵标注和双仿射层注意力的实体抽取方法及系统。本发明由文本数据库模块、文本预处理模块、文本建模模块、输出模块四个部分组成。该系统是首次将图像语义分割的思想融入文本实体抽取的任务中,将传统的序列标注任务转变成方阵标注任务,并使用双仿射层注意力机制将序列表示的语义向量转化为长宽均为文本序列长度的方阵,缓解了中文文本实体识别任务中实体边缘检测难,检测精度低的问题。
-
公开(公告)号:CN116304885A
公开(公告)日:2023-06-23
申请号:CN202310529662.7
申请日:2023-05-11
Applicant: 之江实验室
IPC: G06F18/241 , G06F18/214 , G06F16/22 , G06N3/08 , G06Q40/08
Abstract: 本申请涉及一种基于图节点嵌入的事件识别方法、装置和设备,其中,基于图节点嵌入的事件识别方法包括:基于至少两个关联关系图,分别构建对应的异构关联关系邻接矩阵;将各所述异构关联关系邻接矩阵输入至图节点嵌入模型,获得对应的图节点特征向量;基于各所述历史事件的图节点特征向量以及第一特征对模型进行训练,获得事件识别模型;基于所述事件识别模型对待识别事件进行识别,获得待识别事件的识别结果,在模型训练的过程中增加了各历史事件的图节点特征向量,解决了相关技术中存在的事件识别不准确的问题,提高了事件识别的准确度。
-
公开(公告)号:CN116932780B
公开(公告)日:2024-01-09
申请号:CN202311179452.6
申请日:2023-09-13
Applicant: 之江实验室
Abstract: 本申请涉及一种天文知识图谱构建方法、资源查找方法、设备和介质,获取资源对应的天体信息,其中,天体信息包括天体的形态特征和天体的坐标;基于形态特征对天体分类,得到多个天体类别;根据天体的坐标计算同一天体类别下每两个天体之间的距离,将每个天体作为节点,将属于同一个天体类别的每两个天体进行关联,构建得到多个知识图谱;获取各天体的光谱特征,在任意第一知识图谱和第二知识图谱之间,将具备相似光谱特征的天体进行关联。通过本申请天文知识图谱构建方法,提高了构建的知识图谱的准确性,有利于相关人员基于知识图谱搜索系统、完善的天体信息。(56)对比文件陈淑鑫;孙伟民;王丽丽.网格聚类分析天文光谱数据.计算机科学.2017,(第S2期),463-466.
-
公开(公告)号:CN117235316A
公开(公告)日:2023-12-15
申请号:CN202311187793.8
申请日:2023-09-14
Applicant: 之江实验室
IPC: G06F16/903 , G06F16/901 , G06N5/01
Abstract: 本申请涉及一种基于贪心搜索的最大归集子图的检测方法和装置。该方法包括:获取待检测有向图,将待检测有向图拆分出至少一个弱连通图;计算弱连通图中每个节点的节点入出差;基于节点入出差,在每一个弱连通图中检测具有大归集度的子图,得到各个弱连通图对应的初始最大归集子图;其中,归集度基于子图中的节点入出差的平均值而得到;基于初始最大归集子图,得到待检测有向图的目标最大归集子图。采用本方法能够在大规模有向图上拆分出多个弱连通图,分别从每个弱连通图中搜索归集性结构的子图,实现了在大规模有向图上对归集性结构的子图的准确高效的挖掘,解决了现有的子图搜索方法复杂度较高,计算量较大的问题。
-
公开(公告)号:CN117009492A
公开(公告)日:2023-11-07
申请号:CN202311269299.6
申请日:2023-09-28
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/33 , G06F16/36 , G06F40/186
Abstract: 本申请涉及一种基于本地知识库与自然语言大模型的图查询方法与系统,其中,基于本地知识库与自然语言大模型的图查询方法包括:结合图数据库中获取的图谱结构与本地知识库文档,生成多个领域知识问题与图数据库查询命令的组合;将用户输入的问题转化为对应的向量,并确定与所述用户输入问题对应的向量相匹配的K个领域知识问题与图数据库查询命令的组合;将所述用户输入的问题与所述K个领域知识问题与图数据库查询命令的组合填充到预设的上下文提示模版,得到填充后的问题,并将填充后的问题输入至所述预训练自然语言大模型,生成最终的图数据库查询命令;使用所述最终的图数据库查询命令查询图数据库得到查询结果,提高了图查询结果的准确性。
-
公开(公告)号:CN116306657B
公开(公告)日:2023-08-22
申请号:CN202310565366.2
申请日:2023-05-19
Applicant: 之江实验室
IPC: G06F40/295 , G06F16/33 , G06N20/00 , G06F16/35
Abstract: 本发明公开一种基于方阵标注和双仿射层注意力的实体抽取方法及系统。本发明由文本数据库模块、文本预处理模块、文本建模模块、输出模块四个部分组成。该系统是首次将图像语义分割的思想融入文本实体抽取的任务中,将传统的序列标注任务转变成方阵标注任务,并使用双仿射层注意力机制将序列表示的语义向量转化为长宽均为文本序列长度的方阵,缓解了中文文本实体识别任务中实体边缘检测难,检测精度低的问题。
-
公开(公告)号:CN116304885B
公开(公告)日:2023-08-22
申请号:CN202310529662.7
申请日:2023-05-11
Applicant: 之江实验室
IPC: G06F18/241 , G06F18/214 , G06F16/22 , G06N3/08 , G06Q40/08
Abstract: 本申请涉及一种基于图节点嵌入的事件识别方法、装置和设备,其中,基于图节点嵌入的事件识别方法包括:基于至少两个关联关系图,分别构建对应的异构关联关系邻接矩阵;将各所述异构关联关系邻接矩阵输入至图节点嵌入模型,获得对应的图节点特征向量;基于各所述历史事件的图节点特征向量以及第一特征对模型进行训练,获得事件识别模型;基于所述事件识别模型对待识别事件进行识别,获得待识别事件的识别结果,在模型训练的过程中增加了各历史事件的图节点特征向量,解决了相关技术中存在的事件识别不准确的问题,提高了事件识别的准确度。
-
公开(公告)号:CN115545027A
公开(公告)日:2022-12-30
申请号:CN202211072425.4
申请日:2022-09-02
Applicant: 之江实验室
IPC: G06F40/295 , G06F40/169
Abstract: 本发明公开了一种基于弱标签标注文本的公司名实体识别方法。该方法包括:将清洗后的弱标签文本集使用通用公司名词库继续标注并切分成多个包含5000样本的文本子集;然后由BERT预训练神经网络和Softmax回归模型构建的模型在每个文本子集上进行训练,在每轮训练结束后,识别并筛选文本中的未标注公司名字段,并使用分词模型过滤无用字段。重复该步骤,直至不再产生新的未标注公司名;最后,将未标注公司名在文本集上继续标注,并将模型在最终标注的文本集上继续训练。此外,本方法在弱标签公司名实体识别场景中,首次考虑了模型在欠拟合状态下能够识别未标注公司名的特性,并使用分词模型过滤模型识别出的无用字段,提高了弱标签公司名实体识别的准确率。
-
公开(公告)号:CN117786061A
公开(公告)日:2024-03-29
申请号:CN202311675342.9
申请日:2023-12-06
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/36 , G06F18/213 , G06F18/25 , G06N3/045 , G06N3/08
Abstract: 本说明书公开了一种基于时空注意力机制的大语言模型预测方法及装置,可以用于处理目标实体及部分关联实体的下游预测任务,包括:通过将目标实体及关联实体的初始特征和动态知识图谱输入到空间注意力网络中得到空间拓扑特征;将空间拓扑特征输入到时序注意力网络中得到时空特征;利用目标实体及部分关联实体的时空特征生成隐式提示,并将目标实体的显式的事件文本合并生成提示信息;将提示信息输入给大语言模型,保持大语言模型的参数固定不变,利用下游预测任务的标注信息和损失函数来训练空间注意力网络和时序注意力网络;最后根据训练好的网络来处理目标实体及部分关联实体的下游预测任务。
-
-
-
-
-
-
-
-
-