-
公开(公告)号:CN118333153A
公开(公告)日:2024-07-12
申请号:CN202410491855.2
申请日:2024-04-23
Applicant: 之江实验室
IPC: G06N5/022 , G06N5/04 , G06F18/214
Abstract: 本发明公开了一种基于大语言模型的柔性思维链学习方法、设备和介质,利用大语言模型针对任务进行初始的思维链模板生成,使用思维链模板进行分布答案生成,经过针对最终输出结果的样本粗筛选和针对各个步骤结构的样本精筛选后,得到训练样本数据集;使用监督学习的方法训练柔性思维链模型用于任务推理;柔性思维链模型包括:大语言模型、各个步骤的柔性参数层、prompt层;将柔性参数层、prompt层、训练样本数据集输入大语言模型中,输出结果与样本真值进行一致性判断,得到的惩罚函数优化柔性参数层。本发明提升了推理精度,降低了思维链的构建难度,同时降低了大语言模型调用成本。
-
公开(公告)号:CN117036060A
公开(公告)日:2023-11-10
申请号:CN202311263260.3
申请日:2023-09-27
Applicant: 之江实验室
IPC: G06Q40/08 , G06F16/36 , G06F16/2458 , G06N3/084 , G06N5/025 , G06N7/01 , G06F40/295
Abstract: 本申请涉及一种车险欺诈识别方法、装置和存储介质。主要包括:构建车险结构化数据库;基于车险结构化数据库和车险理赔流程业务,得到候选一阶谓词;基于车险结构化数据库和候选一阶谓词构建知识图谱;利用规则挖掘算法对知识图谱进行挖掘,得到车险欺诈识别规则集;基于车险欺诈识别规则集,构建并训练随机过程模型,得到训练完备的随机过程模型;基于车险欺诈识别规则集,将待识别车险理赔数据进行实例化后输入至训练完备的随机过程模型中,输出车险欺诈识别结果。采用本方法能够实现规则的自动挖掘和车险欺诈识别的推理,解决了现有技术中车险欺诈识别过程不具备可解释性的问题,提高车险欺诈结果的准确率。
-
公开(公告)号:CN117610541B
公开(公告)日:2024-06-11
申请号:CN202410067264.2
申请日:2024-01-17
Applicant: 之江实验室
IPC: G06F40/205 , G06F40/253
Abstract: 本申请涉及一种大规模数据的作者消歧方法、装置及可读存储介质,所述方法包括:基于所述大规模数据和预先定义的谓词,生成对应的谓词实例数据;其中,所述大规模数据包括结构化存储的文献信息和对应的作者信息;所述谓词实例数据包括文献作者对;将所述谓词实例数据切分为多个初始数据块;基于预先确定的一阶逻辑规则,对所述多个初始数据块中具有相同作者的文献作者对进行合并,生成最终数据块;基于所述最终数据块中的文献作者对,生成所述大规模数据对应的作者标识信息,解决了相关技术中存在的对大规模学术文献数据的作者消歧效率较低的问题。
-
公开(公告)号:CN117173725B
公开(公告)日:2024-04-09
申请号:CN202311456584.9
申请日:2023-11-03
Applicant: 之江实验室
IPC: G06V30/412 , G06V30/416 , G06V30/262 , G06F40/30 , G06F40/232 , G06F40/242 , G06F18/22 , G06F18/20
Abstract: 本申请涉及一种表格信息处理方法、装置、计算机设备和存储介质。所述方法包括:获取包含待识别表格的待识别图片;基于文本检测识别模型,从待识别图片提取第一表格信息;根据表格信息处理规则,对第一表格信息进行处理,得到第二表格信息;从第二表格信息中提取各基础数据行对应的数据对,并将各数据行对应的数据对存储至数据库。本申请的方法,能够提高从待识别表格中获取的数据的准确性。
-
公开(公告)号:CN117173725A
公开(公告)日:2023-12-05
申请号:CN202311456584.9
申请日:2023-11-03
Applicant: 之江实验室
IPC: G06V30/412 , G06V30/416 , G06V30/262 , G06F40/30 , G06F40/232 , G06F40/242 , G06F18/22 , G06F18/20
Abstract: 本申请涉及一种表格信息处理方法、装置、计算机设备和存储介质。所述方法包括:获取包含待识别表格的待识别图片;基于文本检测识别模型,从待识别图片提取第一表格信息;根据表格信息处理规则,对第一表格信息进行处理,得到第二表格信息;从第二表格信息中提取各基础数据行对应的数据对,并将各数据行对应的数据对存储至数据库。本申请的方法,能够提高从待识别表格中获取的数据的准确性。
-
公开(公告)号:CN117077679A
公开(公告)日:2023-11-17
申请号:CN202311332338.2
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06F40/295 , G06F40/216 , G06F16/35
Abstract: 本申请涉及一种命名实体识别方法和装置。所述方法包括:获取专业知识数据库;其中,专业知识数据库包括至少两个粒度实体;确定与粒度实体对应的价值评分,基于价值评分从粒度实体中确定目标实体,并根据目标实体以及对应于目标实体的预设指令模板,得到提示指令模板;基于提示指令模板和获取到的待识别数据,生成第一待识别文本信息,对第一待识别文本信息进行命名实体识别处理,得到命名实体识别结果。采用本方法能够实现高效且准确地针对专业领域的专业型命名实体识别。
-
公开(公告)号:CN117575044A
公开(公告)日:2024-02-20
申请号:CN202311654723.9
申请日:2023-12-05
Applicant: 之江实验室
Abstract: 本申请涉及一种数据遗忘学习方法、装置、数据处理系统和存储介质,其中,该数据遗忘学习方法包括:在接收到针对数据处理系统中目标边缘节点的移除请求的情况下,根据数据处理系统中任意两个边缘节点的梯度相似度,将若干个边缘节点划分成节点簇;将目标边缘节点所在的节点簇识别为目标节点簇,将数据处理系统中目标节点簇之外的各个节点簇识别为其他节点簇;获取由目标节点簇上传的,根据初始簇模型进行遗忘学习得到遗忘模型;获取由其他节点簇上传的,根据初始簇模型进行训练得到其他簇模型;根据遗忘模型和其他簇模型,得到移除目标边缘节点的数据处理系统,通过本申请,提升了数据处理的效率,减少了内存资源的消耗。
-
公开(公告)号:CN117094394B
公开(公告)日:2024-01-30
申请号:CN202311333807.2
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06N5/022 , G06F16/2453 , G06F16/2455
Abstract: 本申请涉及一种基于论文PDF的天文多模态知识图谱构建方法和系统,其中,该方法包括:将预选的天文领域论文的PDF文档作为目标文档;将目标文档拆分为至少一张图片,得到目标图片;对目标图片中的图像、图注以及文本信息进行识别,得到图像文本对;根据天文领域中的实体,构建图谱本体;根据图像文本对和图谱本体,构建天文多模态知识图谱;基于天文多模态知识图谱,对目标资料进行检索,得到检索结果,通过本申请,解决了研究者无法从网络资料中快速检索到天文领域相关的目标资料问题,提高了研究者对天文领域相关的目标资料的检索效率。
-
公开(公告)号:CN116910232B
公开(公告)日:2024-01-09
申请号:CN202311179447.5
申请日:2023-09-13
Applicant: 之江实验室
IPC: G06F16/335 , G06F16/33 , G06F16/31
Abstract: 本申请涉及一种天文文献检索方法和天文文献搜索方法,其中,该天文文献检索方法包括:获取天文检索数据,对天文检索数据进行向量化编码,得到检索向量;基于天文检索数据中的文献属性,利用知识库索引引擎从预设的文献库中为天文检索数据匹配第一候选文献数据;基于检索向量,利用向量相似矩阵结合向量索引引擎,从文献库中为天文检索数据匹配第二候选文献数据;合并第一候选文献数据和第二候选文献数据,得到检索结果。其能够基于多种索引引擎分别实现天文文献数据的检索,从而提高检索的全面度和准确度。
-
公开(公告)号:CN117094394A
公开(公告)日:2023-11-21
申请号:CN202311333807.2
申请日:2023-10-16
Applicant: 之江实验室
IPC: G06N5/022 , G06F16/2453 , G06F16/2455
Abstract: 本申请涉及一种基于论文PDF的天文多模态知识图谱构建方法和系统,其中,该方法包括:将预选的天文领域论文的PDF文档作为目标文档;将目标文档拆分为至少一张图片,得到目标图片;对目标图片中的图像、图注以及文本信息进行识别,得到图像文本对;根据天文领域中的实体,构建图谱本体;根据图像文本对和图谱本体,构建天文多模态知识图谱;基于天文多模态知识图谱,对目标资料进行检索,得到检索结果,通过本申请,解决了研究者无法从网络资料中快速检索到天文领域相关的目标资料问题,提高了研究者对天文领域相关的目标资料的检索效率。
-
-
-
-
-
-
-
-
-