一种图像文字信息提取方法、系统及存储介质

    公开(公告)号:CN113673205A

    公开(公告)日:2021-11-19

    申请号:CN202110969030.3

    申请日:2021-08-23

    Abstract: 本申请公开了一种图像文字信息提取方法、系统及存储介质,其方法通过对图文数据集进行文本转换后,得到文本数据,通过对文本数据进行分词,计算各个词组与预设的主题特征词库中的各个主题特征词的相似度,将相似度大于预设相似度的词组作为关键特征词,从而过滤掉偏离主题的文本数据,同时,通过对关键特征词赋予权重将所有词组划分为热词和非热词,根据非热词的数量过滤非关键图文数据,并对非关键图文数据,以缩小非关键图文数据的容量,降低其图像文字提取的进程的占用空间,同时,通过对关键图文数据中的热词进行候选框标注,调用图形文字信息提取模型提取候选框标注内的热词,从而可以提高图像文字信息提取效率和准确度。

    一种数据资产管理系统及方法
    4.
    发明公开

    公开(公告)号:CN119599255A

    公开(公告)日:2025-03-11

    申请号:CN202411553016.5

    申请日:2024-11-01

    Abstract: 本发明涉及数据资产管理技术领域,尤其涉及一种数据资产管理系统及方法。所述方法包括以下步骤:通过从不同的数据源中实时采集数据资产信息集合并进行标签结构子列划分,以得到数据资产信息标签描述结构化子列,同时进行创建时序同步处理并整合存储至数据资产管理数据库;对数据资产管理数据库内每一个的数据资产子信息进行使用频率及敏感性评估分析,并进行数据资产访问效用评估分析,得到每一个数据资产子信息的数据访问效用;对数据资产管理数据库内每一个的数据资产子信息进行动态访问权限控制和全生命周期管理设计,并进行自动化管理及报告反馈记录,以生成数据资产信息管理报告。本发明能够提高数据资产管理的透明度、安全性和效率。

    一种流批数据快速融合方法
    10.
    发明公开

    公开(公告)号:CN119026070A

    公开(公告)日:2024-11-26

    申请号:CN202410910249.X

    申请日:2024-07-09

    Abstract: 本发明公开了一种流批数据快速融合方法,包括流批一体化架构、流批统一接口、数据预处理和缓存、实时流数据窗口化、数据格式标准化、并行计算和分布式处理、实时流数据存储和实时流数据索引,所述流批一体化架构主要包括:先收集各种流批数据和批量处理数据,然后对该数据进行解析和格式化,然后通过流批一体化架构集成实时流数据处理和批量数据处理,通常包括实时计算引擎和批处理引擎。通过流批一体化架构,能够将实时流数据和批量数据快速融合,使得企业能够更快速地开展实时决策和应对突发事件,可以充分利用实时处理和批量处理的优势,根据不同的需求灵活分配资源,提高数据处理的效率和性能,使得数据分析更加全面。

Patent Agency Ranking