监管指令的任务匹配方法、装置、设备、存储介质和产品

    公开(公告)号:CN119851101A

    公开(公告)日:2025-04-18

    申请号:CN202411971510.3

    申请日:2024-12-30

    Inventor: 杨迪

    Abstract: 本申请涉及一种监管指令的任务匹配方法、装置、设备、存储介质和产品。方法包括:获取监管指令,并将监管指令转换为指令图像;将指令图像输入至特征提取模型,获得输出的风格增强视觉特征;识别指令图像中显示有文本信息的文本区域,并提取文本区域的文本语义风格特征;将风格增强视觉特征中的特征与文本语义风格特征中的特征拼接,形成多个拼接特征;获取每组拼接特征与每个任务特征向量之间的相关度,并确定每个任务特征向量针对指令特征矩阵的相关度;根据每个任务特征向量针对指令特征矩阵的相关度,确定最大相关度对应的任务作为监管指令的最佳匹配任务。采用本方法能够提升针对监管指令的任务匹配效率。

    一种特征库压缩方法、装置、电子设备及存储介质

    公开(公告)号:CN118839787A

    公开(公告)日:2024-10-25

    申请号:CN202410869027.8

    申请日:2024-06-28

    Inventor: 杨迪

    Abstract: 本申请公开了一种特征库压缩方法、装置、电子设备及存储介质,用以解决现有特征库压缩方式降低机器学习模型的精准度的问题,所述方法包括:针对特征库中的每一特征,获取特征对应的衍生指向度,特征对应的衍生指向度表征特征与特征库中其他特征之间的依赖程度;基于特征对应的衍生指向度与其他各特征对应的衍生指向度之间的偏差,分别确定特征与其他各特征之间的偏差;将特征和与其偏差最小的特征确定为一组特征分支最小结构;根据每一组特征分支最小结构对应的衍生指向度确定各自对应的权重,特征分支最小结构对应的衍生指向度表征特征分支最小结构与其他特征分支最小结构之间的依赖程度;将权重小于预设阈值的特征分支最小结构从特征库中删除。

    一种词库生成方法及相关装置
    4.
    发明公开

    公开(公告)号:CN116911285A

    公开(公告)日:2023-10-20

    申请号:CN202310822651.8

    申请日:2023-07-05

    Abstract: 本申请提供了一种词库生成方法及相关装置,用以提供快速、便捷建立共性关键词库的方式。本申请实施例提供一种词库生成方法,可以包括获取第一样本库和第二样本库,其中,所述第一样本库和所述第二样本库为不同的词库,样本库中的每个文本包括一个或多个词,一个词包括一个或多个字;合成所述第一样本库和所述第二样本库,得到目标词库;对所述目标词库中符合预设条件的第二文本拆分为两个词,并增加到所述目标词库中,其中,所述第二文本为包括多个词的文本。

    一种数据流特征整合方法、装置及电子设备

    公开(公告)号:CN117009920A

    公开(公告)日:2023-11-07

    申请号:CN202310882166.X

    申请日:2023-07-18

    Inventor: 杨迪

    Abstract: 本申请提供了一种数据流特征整合方法、装置及电子设备,涉及数据安全技术领域。在本申请中,首先获取第一数据流对应的第一属性数据集合和第二数据流对应的第二属性数据集合,基于第一属性数据集合中的第一属性数据和第二属性数据集合中与第一属性数据对应的第二属性数据,计算各项属性突变指标值,然后融合各项属性突变指标值,得到属性突变融合指标值,并基于属性突变融合指标值,重构第一数据流对应的第一权重值和第二数据流对应的第二权重值;最后基于第一权重值和第二权重值对第一数据流和第二数据流进行特征整合,采用这种方式,能够提升对第一数据流和第二数据流进行特征整合的准确性。

    数据识别器训练、数据识别方法、装置、电子设备及介质

    公开(公告)号:CN115221974B

    公开(公告)日:2024-09-06

    申请号:CN202210929114.9

    申请日:2022-08-03

    Abstract: 本公开提供了一种数据识别器训练、数据识别方法、装置、电子设备及介质,涉及数据安全技术领域。该数据识别器训练方法包括:获取第一训练集,第一训练集中分别包括多个类别的样本,所述多个类别的样本的分布不均衡;训练所述第一训练集,得到第一分类器;循环执行如下迭代过程,直至所述多个类别的样本的分布均衡:调整所述多个类别的样本的数量,得到第二训练集,训练所述第二训练集,得到第二分类器;基于所述第一分类器和所述第二分类器,得到数据识别器。该训练方法加强了对小类别样本的学习效果,解决了由于样本稀少导致对小类别样本训练不足、识别准确率低的问题,能够在小类别样本不足的情况下,提高了数据识别器的拟合能力和准确率。

    关键数据表识别方法及装置、计算机可存储介质

    公开(公告)号:CN115794961A

    公开(公告)日:2023-03-14

    申请号:CN202211464769.X

    申请日:2022-11-22

    Abstract: 本公开涉及关键数据表识别方法及装置、计算机可存储介质,涉及数据处理技术领域。关键数据表识别方法包括:获取目标领域的多个数据表及其属性信息、与所述目标领域的相关标准对应的基础数据元集合;根据所述多个数据表的属性信息与所述基础数据元之间的匹配情况,构建所述多个数据表之间的关联网络,其中,所述关联网络以每个数据表为节点,数据表之间的关联关系为边;根据所述关联网络,识别所述多个数据表中的关键数据表。根据本公开,可以提高关键数据表的识别准确率。

    图片分类方法及装置、电子设备、计算机可读介质

    公开(公告)号:CN115457333A

    公开(公告)日:2022-12-09

    申请号:CN202211250720.4

    申请日:2022-10-12

    Abstract: 本申请的实施例公开了一种图片分类方法及装置、电子设备、计算机可读介质,该图片分类方法包括:获取待分类分片组;其中,待分类分片组中包括多个待分类分片,多个待分类分片是对待分类图片拆分得到的;将多个待分类分片与多个标准分片组含有的标准分片进行特征比对,得到多个待分类分片针对每个标准分片组的第一特征比对值;根据多个第一特征比对值从预设整体图片集合中选择目标图片;其中,预设整体图片集合中包括多个标准分片组分别对应的标准图片;将待分类图片与目标图片进行特征比对,得到第二特征比对值,并根据第二特征比对值对待分类图片进行分类。通过该方法,可以提高图片识别率。

Patent Agency Ranking