一种文本的快速扫描方法、装置、电子设备及存储介质

    公开(公告)号:CN117675417A

    公开(公告)日:2024-03-08

    申请号:CN202410145684.8

    申请日:2024-02-02

    Abstract: 本申请提供了一种文本的快速扫描方法、装置、电子设备及存储介质,涉及计算机技术领域,该方法包括:利用状态转移矩阵中零状态下进行非零转移的字符,在寄存器中创建非零转移字符集合;从待扫描文本中选取目标字符,确定目标字符在待扫描文本中的字符位置是否处于第一预设字符区间内,针对目标字符对应的第二预设字符区间内的每个字符,确定该字符是否属于非零转移字符集合;若均不属于非零转移字符集合,将第二预设字符区间外的首个字符作为新的目标字符,返回执行确定目标字符在待扫描文本中字符位置是否处于第一预设字符区间内的步骤。通过采用上述文本的快速扫描方法、装置、电子设备及存储介质,解决了现有技术中,文本扫描速度慢的问题。

    一种人物关系知识图谱构建方法、设备、介质及产品

    公开(公告)号:CN118228809A

    公开(公告)日:2024-06-21

    申请号:CN202410151118.8

    申请日:2024-02-02

    Abstract: 本发明公开一种人物关系知识图谱构建方法、设备、介质及产品,涉及数据处理领域。本发明使用面向邻域的打包方案和悬浮标记技术来识别并标记推文语句中的实体跨度,使用超图神经网络结合消息传递来进行高阶推理,最后对超图中的实体节点和关系节点进行分类并使用交叉熵损失监督实体和关系的预测,从而获取大规模社交网络中的人物和实体关系,以使人物实体和关系的提取更加准确,进而使人物关系知识图谱构建更加准确。基于此,有助于企业更有效地构建和维护基于社交网络数据的人物关系知识图谱,为企业提供更深入的洞察力,进而能够为业务决策提供更准确的信息基础,从而推动企业社交网络战略、市场营销和用户关系管理等。

    一种文本的快速扫描方法、装置、电子设备及存储介质

    公开(公告)号:CN117675417B

    公开(公告)日:2024-04-16

    申请号:CN202410145684.8

    申请日:2024-02-02

    Abstract: 本申请提供了一种文本的快速扫描方法、装置、电子设备及存储介质,涉及计算机技术领域,该方法包括:利用状态转移矩阵中零状态下进行非零转移的字符,在寄存器中创建非零转移字符集合;从待扫描文本中选取目标字符,确定目标字符在待扫描文本中的字符位置是否处于第一预设字符区间内,针对目标字符对应的第二预设字符区间内的每个字符,确定该字符是否属于非零转移字符集合;若均不属于非零转移字符集合,将第二预设字符区间外的首个字符作为新的目标字符,返回执行确定目标字符在待扫描文本中字符位置是否处于第一预设字符区间内的步骤。通过采用上述文本的快速扫描方法、装置、电子设备及存储介质,解决了现有技术中,文本扫描速度慢的问题。

    一种知识图谱检索方法、装置、介质及产品

    公开(公告)号:CN118227668A

    公开(公告)日:2024-06-21

    申请号:CN202410153985.5

    申请日:2024-02-02

    Abstract: 本发明公开知识图谱检索方法、装置、介质及产品,涉及图谱检索技术领域,所述方法包括:获取问题文本和多个关键字的向量表示;在知识图谱中,确定关键节点和对应的候选关系;计算各候选关系与问题向量表示之间的匹配得分;基于匹配得分构建子图;生成多个推理指令;利用各推理指令逐步确定子图中各关系的关系推理得分;基于所有关系推理得分,确定对应节点的节点推理得分;节点推理得分最大值满足预设置信阈值时,将节点推理得分最大值的节点对应的实体确定为答案;否则,将节点推理得分从大到小排序,将前第二预设个数个节点作为候选节点;基于大语言模型以及各候选节点和对应的关系构建问题回复模型,实现了面向复杂查询条件的知识图谱检索。

    一种字符串的扫描方法、装置、电子设备及存储介质

    公开(公告)号:CN117975485A

    公开(公告)日:2024-05-03

    申请号:CN202410361724.2

    申请日:2024-03-28

    Abstract: 本申请提供了一种字符串的扫描方法、装置、电子设备及存储介质,涉及数据处理领域,其中,方法包括响应快速扫描模式指令,从获取到的长度为N的待测字符串中按序提取M个字符作为未处理字符组,其中M小于N;针对当前的未处理字符组,确定未处理字符组中是否存在非信任字符;若不存在,则更新未处理字符组;若存在,则确定首个非信任字符为目标字符,根据目标字符所对应的多个预设扫描状态值,确定是否退出快速扫描模式,进而避免了大量的扫描状态占用资源,同时提高了正则表达式匹配中字符串扫描的速度。

    一种基于确定型有限自动机的文本检测方法、装置及设备

    公开(公告)号:CN117690153B

    公开(公告)日:2024-04-05

    申请号:CN202410153901.8

    申请日:2024-02-04

    Abstract: 本申请提供了一种基于确定型有限自动机的文本检测方法、装置及设备,涉及计算机技术领域,该方法包括:确定待检测文本中当前文本段的字符数量是否符合文本分割要求;若符合要求,选取多个候选字符,确定每个候选字符转移为目标状态的次数;根据次数从多个候选字符中选取当前分割字符,利用当前分割字符对当前文本段进行分割获得新的当前文本段;将当前分割字符作为新的前一分割字符,返回执行确定是否符合文本分割要求的步骤;利用多线程中设置的多个确定型有限自动机同时对所有文本段进行检测,获得文本检测结果。通过采用上述基于确定型有限自动机的文本检测方法、装置及设备,解决了现有技术中,检测效率低及检测效率不稳定的问题。

    一种字符串的扫描方法、装置、电子设备及存储介质

    公开(公告)号:CN117975485B

    公开(公告)日:2024-06-07

    申请号:CN202410361724.2

    申请日:2024-03-28

    Abstract: 本申请提供了一种字符串的扫描方法、装置、电子设备及存储介质,涉及数据处理领域,其中,方法包括响应快速扫描模式指令,从获取到的长度为N的待测字符串中按序提取M个字符作为未处理字符组,其中M小于N;针对当前的未处理字符组,确定未处理字符组中是否存在非信任字符;若不存在,则更新未处理字符组;若存在,则确定首个非信任字符为目标字符,根据目标字符所对应的多个预设扫描状态值,确定是否退出快速扫描模式,进而避免了大量的扫描状态占用资源,同时提高了正则表达式匹配中字符串扫描的速度。

    一种基于确定型有限自动机的文本检测方法、装置及设备

    公开(公告)号:CN117690153A

    公开(公告)日:2024-03-12

    申请号:CN202410153901.8

    申请日:2024-02-04

    Abstract: 本申请提供了一种基于确定型有限自动机的文本检测方法、装置及设备,涉及计算机技术领域,该方法包括:确定待检测文本中当前文本段的字符数量是否符合文本分割要求;若符合要求,选取多个候选字符,确定每个候选字符转移为目标状态的次数;根据次数从多个候选字符中选取当前分割字符,利用当前分割字符对当前文本段进行分割获得新的当前文本段;将当前分割字符作为新的前一分割字符,返回执行确定是否符合文本分割要求的步骤;利用多线程中设置的多个确定型有限自动机同时对所有文本段进行检测,获得文本检测结果。通过采用上述基于确定型有限自动机的文本检测方法、装置及设备,解决了现有技术中,检测效率低及检测效率不稳定的问题。

    一种文本的检测方法及装置

    公开(公告)号:CN118132676B

    公开(公告)日:2024-11-26

    申请号:CN202410325753.3

    申请日:2024-03-21

    Abstract: 本申请提供了一种文本的检测方法及装置,该方法包括:将待检测文本划分为多个文本段,以利用多个线程同时对不同文本段进行文本检测;针对每个文本段,在利用目标线程对该文本段进行检测时,一次性获取该文本段中的多个目标字符,并行确定多个目标字符中是否存在非信任字符;若存在非信任字符,则针对多个目标字符中首个非信任字符之后的每个目标字符,确定该目标字符对应的转移状态;若转移状态为目标状态,则返回执行一次性获取该文本段中的多个目标字符的步骤,以针对新获取的多个目标字符进行文本检测。通过采用上述文本的检测方法及装置,解决了文本检测效率低的问题。

    一种文本的检测方法及装置

    公开(公告)号:CN118132676A

    公开(公告)日:2024-06-04

    申请号:CN202410325753.3

    申请日:2024-03-21

    Abstract: 本申请提供了一种文本的检测方法及装置,该方法包括:将待检测文本划分为多个文本段,以利用多个线程同时对不同文本段进行文本检测;针对每个文本段,在利用目标线程对该文本段进行检测时,一次性获取该文本段中的多个目标字符,并行确定多个目标字符中是否存在非信任字符;若存在非信任字符,则针对多个目标字符中首个非信任字符之后的每个目标字符,确定该目标字符对应的转移状态;若转移状态为目标状态,则返回执行一次性获取该文本段中的多个目标字符的步骤,以针对新获取的多个目标字符进行文本检测。通过采用上述文本的检测方法及装置,解决了文本检测效率低的问题。

Patent Agency Ranking