网络数据挖掘的方法及装置、存储介质及电子设备

    公开(公告)号:CN115344626A

    公开(公告)日:2022-11-15

    申请号:CN202210988582.3

    申请日:2022-08-17

    Abstract: 本公开提供了一种网络数据挖掘的方法及装置、存储介质及电子设备,涉及网络数据安全技术领域。这种网络数据挖掘的方法包括提取待识别数据中的关键词K;对所述关键词K,依据词性提取动词V和名词U;对所述动词V和所述名词U进行组合,利用数据关联分析算法寻找所述动词V和所述名词U的突变关系;对所有突变关系求和,并替换待识别样本权重;以及根据重构的新权重组合重新计算待分类重要数据分类。这种网络数据挖掘的方法利用数据关联分析算法,可以找出待识别数据中关键数据间存在的突变关系,再将待识别数据的关键数据权重进行动态重构,并根据重构的新权重组合重新计算待分类重要数据分类,这样可以实现重要数据权重自适应。

    图像文本检测方法、装置、存储介质和计算机程序产品

    公开(公告)号:CN114821023A

    公开(公告)日:2022-07-29

    申请号:CN202110042829.8

    申请日:2021-01-13

    Abstract: 本公开涉及图像文本检测方法、装置、存储介质和计算机程序产品。用于从待检测图像中识别文本区域的方法包括:将已标记出文字区域的图像作为训练数据输入到特征提取模块进行训练以得到文本行区域模型;将待检测图像输入到文本行区域模型以得到文本行区域概率图;将已标记出文本中心区域的图像作为训练数据输入到特征提取模块进行训练以得到文本中心区域模型;将待检测图像输入到文本中心区域模型以得到文本中心区域概率图;基于文本行区域阈值和文本行区域概率图从待检测图像中提取文本行区域;基于文本中心区域阈值和文本中心区域概率图从待检测图像中提取文本中心区域;以及将文本行区域和文本中心区域进行组合以得到待检测图像中的文本区域。

    数据价值的计算方法、装置、可读介质及电子设备

    公开(公告)号:CN114298543A

    公开(公告)日:2022-04-08

    申请号:CN202111627231.1

    申请日:2021-12-28

    Abstract: 本申请公开了一种数据价值的计算方法、装置、可读介质以及电子设备,所述方法包括:根据预设数据分片规则对多个原始数据集分别进行分片处理,得到各个原始数据集对应的多个数据分片,数据分片包括多个待计算数据价值的原始数据;根据各个原始数据集对应的多个数据分片生成多个目标数据集;对各个目标数据集分别进行数据价值计算,得到各个目标数据集对应的数据价值;整合各个目标数据集对应的数据价值,得到目标数据价值。本申请技术方案实现了基于分散数据的数据价值计算,降低了传统数据价值计算所需要的存储压力,通过分布式计算方式获得目标数据价值,降低了传统数据价值计算所需要的算力开销。

    关键信息识别方法、装置以及存储介质

    公开(公告)号:CN114297383A

    公开(公告)日:2022-04-08

    申请号:CN202111643213.2

    申请日:2021-12-29

    Abstract: 本公开提供了一种关键信息识别方法、装置以及存储介质,其中的方法包括:对于关键信息设置对应的权重系数值以及权重系数阈值;如果至少一个权重系数值大于权重系数阈值,则将与大于权重系数阈值的权重系数值对应的关键信息作为识别目标关键信息,并根据识别目标关键信息对待识别文本进行分类处理;如果全部权重系数值都小于或等于权重系数阈值,则计算关键信息之间的关联因子信息;基于关联因子信息计算与待识别文本相对的关联识别权重值,根据关联识别权重值对待识别文本进行分类处理。本公开的方法、装置以及存储介质,可以通过累计相关性提升关键信息识别效果,提升识别的准确率。

    数据预处理方法、装置和计算机可读存储介质

    公开(公告)号:CN110019012B

    公开(公告)日:2021-05-11

    申请号:CN201711245143.9

    申请日:2017-12-01

    Abstract: 本公开提出一种数据预处理方法、装置和计算机可读存储介质,涉及大数据技术领域。本公开的一种数据预处理方法包括:获取HTTP数据;获取超文本传输协议HTTP数据中的用户代理UserAgent字段信息;获取与UserAgent字段信息相关联的标识,标识的长度小于UserAgent字段信息的长度;用标识替换UserAgent字段信息以减少HTTP数据的空间占用量。通过这样的方法,能够将UserAgent字段替换为长度更短的标识,从而压缩了存储UserAgent字段信息需要的存储空间,降低了大数据存储的负担和数据存储成本。

    字符识别方法和装置
    56.
    发明公开

    公开(公告)号:CN112651402A

    公开(公告)日:2021-04-13

    申请号:CN201910960896.0

    申请日:2019-10-11

    Abstract: 本公开公开了一种字符识别方法和装置,涉及互联网领域。该方法包括:对图像中的字符进行检测识别,得到识别结果,其中,识别结果中包括已识别字符和未识别字符;确定已识别字符所属行业;获取已识别字符所属行业的词向量字典;根据词向量字典对识别结果进行词向量计算,识别出未识别字符。本公开提高了字符识别的精确度。

    无人机基站控制方法、装置、系统和计算机可读存储介质

    公开(公告)号:CN111371484A

    公开(公告)日:2020-07-03

    申请号:CN201811585581.4

    申请日:2018-12-25

    Abstract: 本公开涉及一种无人机基站控制方法、装置、系统和计算机可读存储介质,涉及通信技术领域。本公开的方法包括:根据无人机基站测量的雷电环境数据确定雷电的影响程度;根据无人机基站的状态信息确定无人机基站的健康状况;根据雷电的影响程度和无人机基站的健康状况,确定无人机基站的是否继续服务。通过实时的雷电影响和无人机健康状况的综合判断,能够更加准确确定无人机基站是否能够应对当前的雷电环境,能够更加准确确定无人机基站是否能够继续保持服务,在尽量保持通信服务的情况下,提高对无人机基站的保护。

    数据修复方法和装置
    58.
    发明公开

    公开(公告)号:CN108021469A

    公开(公告)日:2018-05-11

    申请号:CN201610925888.9

    申请日:2016-10-31

    Abstract: 本发明提出一种数据修复方法和装置,涉及大数据领域。其中,本发明的一种数据修复方法包括:根据待修复数据的业务类型获取业务类型的数据统计信息,数据统计信息中包括各个字段的字段长度、字段值类型和/或字段值出现频次;根据数据统计信息基于机器学习算法修复待修复数据,获取修复后数据。通过这样的方法,能够基于一个业务类型的数据特点、数据信息统计结果对待修复数据进行检测和修复,减少了大数据资源发生字段不完整、关键字段丢失、字段长度超限值、字段错误等异常现象的概率,提升了大数据资源的质量。

    判别车辆上下匝道的方法和装置

    公开(公告)号:CN106643757A

    公开(公告)日:2017-05-10

    申请号:CN201510726840.0

    申请日:2015-10-30

    CPC classification number: G01C21/3415

    Abstract: 本发明公开一种判别车辆上下匝道的方法和装置。其中移动终端在车辆行进路径上,以预定频率检测车辆与最近匝道入口之间的距离,若距离小于预定门限,则启动加速度传感器、角速度传感器和方向传感器以进行监听,加速度传感器以预定的采样周期生成加速度值,角速度传感器以预定的采样周期生成角速度值,方向传感器以预定的采样周期生成坡度值,当车辆通过与所述最近匝道入口相关联的匝道出口时,关闭各传感器以停止监听,将记录的加速度值、角速度值和坡度值与预先存储的交通模型进行匹配,并根据匹配结果确定车辆是否上下匝道。通过利用车辆的加速度、角度偏转等特征直接、明确地判断车辆是否上下高架路,从而为动态导航提供准确信息。

    虚拟资源调度方法与装置
    60.
    发明公开

    公开(公告)号:CN104866382A

    公开(公告)日:2015-08-26

    申请号:CN201410058955.2

    申请日:2014-02-21

    Abstract: 本发明公开了虚拟资源调度装置与方法,该方法包括:采集业务层参数和网络层参数;根据业务层参数计算业务层指标,以及根据网络层参数计算网络层指标;将业务层指标以及网络层指标分别与各自的阈值进行比较,并根据比较结果调整对资源的分配。本发明可以保证业务开展所需的质量。

Patent Agency Ranking