-
公开(公告)号:CN117473093A
公开(公告)日:2024-01-30
申请号:CN202311785970.2
申请日:2023-12-25
申请人: 中科雨辰科技有限公司
摘要: 本发明涉及一种基于LLM模型获取目标事件的数据处理系统,涉及大语言模型处理技术领域,系统包括第一数据库、第二数据库、处理器和存储有计算机程序的存储器,其中,所述第一数据库中存储有候选事件类型列表,所述第二数据库中存储有候选事件类型列表对应的候选规则集,当计算机程序被处理器执行时,实现以下步骤:获取目标文本和目标任务,获取目标指令信息,将目标文本和目标指令信息输入至第一LLM模型中,获取初始优先级集,获取目标任务对应的第一规则列表和第二规则列表,对初始优先级集进行处理以获取目标优先级集,获取目标事件文本以获取到目标事件,本发明通过设定规则对LLM模型中数据进行处理,提高了获取到目标事件的准确性。
-
公开(公告)号:CN115545009B
公开(公告)日:2023-07-07
申请号:CN202211527410.2
申请日:2022-12-01
申请人: 中科雨辰科技有限公司
IPC分类号: G06F40/205 , G06V30/14 , G06V30/19
摘要: 本发明提供了一种获取目标文本的数据处理系统,包括:处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:根据初始文本集中任一初始文本,获取初始文本对应的初始文本字符串,根据初始文本字符串获取初始文本字符串对应的初始字向量集,根据初始文本字符串对应的初始图像,获取初始文本字符串对应的关键特征向量,根据初始字向量集和关键特征向量,获取初始文本字符串对应的目标字向量集,根据目标字向量集获取初始文本字符串对应的目标文本。本发明丰富了向量的特征,避免了文字特征的遗漏,使得自然语言处理的准确度较高,提高了文本分类的准确度,进而使得获取到的目标文本的准确度较高。
-
公开(公告)号:CN116167339A
公开(公告)日:2023-05-26
申请号:CN202211543320.2
申请日:2022-12-02
申请人: 中科雨辰科技有限公司
IPC分类号: G06F40/134 , G06F40/216
摘要: 本发明提供了一种基于实体关系获取链接实体的数据处理系统,系统包括初始实体列表、预设实体关系优先级集、处理器和存储由计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:将初始实体的数量与预设的实体数量阈值进行比对,当初始实体的数量大于等于预设的实体数量阈值时,获取初始实体列表对应的关键实体集和关键实体集对应的关键实体优先级集,根据关键实体优先级集,获取中间实体集和中间实体集对应的中间优先级集,根据中间优先级集,获取中间实体对应的链接实体列表;本发明能够基于实体关系和实体关系与实体关系之间的关联程度,对实体优先级进行处理,获取到更加精确的实体优先级,提高了获取链接实体的准确度。
-
公开(公告)号:CN115795051B
公开(公告)日:2023-05-23
申请号:CN202211543319.X
申请日:2022-12-02
申请人: 中科雨辰科技有限公司
IPC分类号: G06F16/36 , G06F16/383
摘要: 本发明提供了一种基于实体关系获取链接实体的数据处理系统,所述系统包括:初始实体列表、预设实体关系优先级集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:当初始实体的数量大于等于预设的实体数量阈值时,获取关键实体集和关键实体优先级集,从初始实体列表中删除最大关键优先级的关键实体对应的初始实体,根据预设实体关系优先级集,获取第一中间实体集对应的第一关键优先级集,从而获取第一目标链接实体列表,根据第一目标链接实体列表获取第二目标链接实体列表;本发明能够在获取链接实体的过程中,未对每个实体优先级进行多次处理,增加了获取链接实体的效率,从而提高了获取链接实体的准确度。
-
公开(公告)号:CN115544215B
公开(公告)日:2023-03-31
申请号:CN202211534322.5
申请日:2022-12-02
申请人: 中科雨辰科技有限公司
IPC分类号: G06F16/33 , G06F40/289
摘要: 本发明提供了一种关联对象的获取方法、介质及设备,所述方法包括如下步骤:获取初始对象列表和初始事件标签集,获取目标对象和目标对象对应的目标事件标签,根据初始对象列表、初始事件标签集、目标对象和目标对象对应的目标事件标签,获取目标对象对应的关键对象列表,获取候选对象列表对应的候选事件标签集,获取候选事件标签列表中不包括目标事件标签的对应的候选对象作为目标对象的关键对象,根据目标对象对应的目标事件标签和目标对象对应的关键对象列表获取目标对象的关联对象。本发明一方面,获取与事件标签不一致的事件,减少了可匹配对象的数据量,使得获取到的关联事件的准确度较高。
-
公开(公告)号:CN115577713B
公开(公告)日:2023-03-17
申请号:CN202211565438.5
申请日:2022-12-07
申请人: 中科雨辰科技有限公司
IPC分类号: G06F40/295 , G06F40/211 , G06F40/30 , G06F16/36
摘要: 本申请涉及电数字数据处理技术领域,特别是涉及一种基于知识图谱的文本处理方法。该方法包括以下步骤:S100,获取目标文本中的实体集合{A,B};S200,获取目标文本的三元组集合{TAA,TBB,TAB};S300,如果TAA≠∅,则根据IDAA获取目标文本的主语对应的组成实体ZA;S400,如果TBB≠∅,则根据IDBB获取目标文本的宾语对应的组成实体ZB;S500,获取目标文本的目标三元组T=(X1,EAB,X2)。本发明提高了获取目标文本的语义关系的准确性。
-
公开(公告)号:CN115270802B
公开(公告)日:2023-01-03
申请号:CN202211195543.4
申请日:2022-09-29
申请人: 中科雨辰科技有限公司
IPC分类号: G06F40/295 , G06F40/211 , G06F40/35
摘要: 本发明涉及一种问题语句的处理方法,所述方法包括如下步骤:获取目标问题语句列表,根据目标问题语句,得到对应的目标三元组并获取到对应的中间实体链路列表,其中,中间实体链路包括中间实体列表和中间关系列表,遍历中间实体列表,确定为目标实体链路;遍历目标实体链路对应的中间关系且当目标实体链路对应的所有中间关系均为继承关系时,则将目标实体链路作为最终实体链路;根据最终实体链路,获取到目标问题语句的结果;使得对目标问题语句的处理更高效、更准确。
-
公开(公告)号:CN114996389B
公开(公告)日:2022-10-11
申请号:CN202210931064.8
申请日:2022-08-04
申请人: 中科雨辰科技有限公司
摘要: 本发明涉及数据处理领域,具体涉及一种标注类别一致性检验方法、存储介质及电子设备,所述方法包括:采用m个子模型对数据集分为K组经过一致性检验,获取子模型对数据集的K个第一置信程度,获取K个第一置信程度的离散程度的倒数作为数据集在子模型中的一致程度;根据开源数据集在子模型中的一致程度获取模型权重;将每个子模型对数据集的一致程度和模型权重的加权值归一化作为整体一致性程度Sco;m个子模型对数据集获取m个一致程度,通过调整子模型的模型权重,提高准确率高的子模型在获取整体一致性程度Sco时的占比,能够使最终的整体一致性程度Sco更加客观准确。
-
公开(公告)号:CN114996414B
公开(公告)日:2022-09-30
申请号:CN202210935535.2
申请日:2022-08-05
申请人: 中科雨辰科技有限公司
IPC分类号: G06F16/33 , G06F16/335
摘要: 本发明涉及一种确定相似事件的数据处理系统,系统包括:数据库、处理器和存储有计算机程序的存储器,其中,数据库中包括预设的触发词集和预设的论元集,当计算机程序被处理器执行时,实现以下步骤:获取目标事件的第一触发词编码向量和第一论元编码向量,获取关键事件对应的第二触发词编码向量和第二论元编码向量,在获取第一论元编码向量和第二论元编码向量过程中进行特征分解,获取到第一目标编码向量列表和第二目标编码向量列表,通过目标事件与关键事件的相似度确定目标事件的相似事件。本发明提供了一种新的获取事件相似度的方法,通过特征分解未破坏论元本身特征的情况下,降低了事件的重复度,使获取的事件相似度的准确度较高。
-
公开(公告)号:CN114880131B
公开(公告)日:2022-09-30
申请号:CN202210809901.X
申请日:2022-07-11
申请人: 中科雨辰科技有限公司
摘要: 本申请提供了一种基于任务的动态编排系统,该系统从设定的算法模型数据库中自动获取或者编排满足用户输入功能的实现方法,并且可以根据用户的实际需求和设备资源为用户挑选最适合的实现方法以供用户进行选择,基于用户挑选的实现方法,使用docker技术对其进行打包。本发明可以方便用户使用且无需人工自动化进行打包,能够节省时间资源。
-
-
-
-
-
-
-
-
-