一种批量异构数据源自动比对系统、方法及设备

    公开(公告)号:CN113495890B

    公开(公告)日:2024-05-14

    申请号:CN202110774008.3

    申请日:2021-07-08

    发明人: 高利平

    摘要: 本申请公开了一种批量异构数据源自动比对系统、方法及设备,所述系统包括为每种数据源单独定义的数据源模块,用于创建临时表、并借助临时表对源表、目标表的总量及明细进行比对的数据比对模块,批量比对脚本模块以及比对结果形成模块。本申请基于总量查询和分页明细查询逐一将源表数组和目标表数组中的待比对的源表以及目标表进行比对,进而将批量比对结果进行txt文件存储,实现了异构数据源的混合批量自动比对。本申请的技术方案将数据源代码与比对代码分离,将网状比对链路变成星型比对链路,并借助临时表分批处理数据,解决了大数据量查询内存溢出的问题。

    一种判断文件是否完整落盘的控制方法及装置

    公开(公告)号:CN112035069B

    公开(公告)日:2024-02-27

    申请号:CN202010977544.9

    申请日:2020-09-17

    发明人: 朱佳鑫

    IPC分类号: G06F3/06

    摘要: 本发明公开了一种判断文件是否完整落盘的控制方法,其通过捕捉文件预写处理信息实现对于文件落盘的判断,包括如下步骤:a:基于文件的预写处理获取缓存写入IO的最终位置以及非缓存写入IO的最终位置,所述最终位置至少包括写入的偏移以及写入的大小;b:当所述文件的非缓存写入IO的最终位置大于或等于缓存写入IO的最终位置时,确定所述文件完整落盘;c:将所述文件通知给应用层,让其获取文件信息,md5。本发明对数据落盘的流程和时机是不干预的,方案简单便捷,而市面上大多数技术方案均会干预数据的落盘时机,都是一种参数调优的方案。本发明技术方案简单、功能强大、能准确高效的判断文件是否完整落盘,具有极高的商业价值。

    一种权限申请与敏感信息采集的检测方法、装置及系统

    公开(公告)号:CN116776298A

    公开(公告)日:2023-09-19

    申请号:CN202310380547.8

    申请日:2023-04-11

    发明人: 张超

    IPC分类号: G06F21/12 G06F21/51 G06F21/62

    摘要: 本申请公开了一种权限申请与敏感信息采集的检测方法、装置及系统,所述方法包括:监测终端与待检测的移动终端建立通信连接,移动终端上运行有至少一个应用程序APP;监测终端获取待检测的目标应用程序的包名和模块,启动对应包名的APP进程,获取对所述模块进行覆写的预设的JavaScript脚本;将包名、预设的JavaScript脚本注入移动终端的目标应用程序中;被覆写后的模块监测模块在运行时的调用信息,当模块代码被调用时,执行预设的JavaScript脚本,收集调用结果,并将调用结果返回至监测终端。本申请通过覆写目标应用程序中指定模块的代码,动态检测安卓应用程序的权限申请,实时检测敏感个人信息的采集。

    一种基于海豚调度的任务多形态预警系统及方法

    公开(公告)号:CN116737332A

    公开(公告)日:2023-09-12

    申请号:CN202310506418.9

    申请日:2023-05-06

    发明人: 康珊伟

    IPC分类号: G06F9/48 G06F9/50

    摘要: 本发明提供了一种基于海豚调度的任务多形态预警系统,包括:预警可视化模块,用于显示出现错误的任务,以及对出现错误的任务进行管理;预警中心模块,用于存储预警等级、预警方式,以及向用户发出预警通知;海豚调度模块,用于创建工作流和工作流下的任务的预警优先级,并存储工作流和工作流下的任务。本发明在预警中心模块设置预警等级,在海豚调度模块中设置预警优先级,通过预警中心模块获取海豚调度模块出现错误的工作流下的任务,将预警优先级与预警等级匹配,对工作流下的任务进行多形态预警,实现海豚调度任务出错时及时通知开发人员,及时处理出现错误的任务。

    一种数据仓库的数据质量校验系统及校验方法

    公开(公告)号:CN116069775B

    公开(公告)日:2023-08-22

    申请号:CN202310354204.4

    申请日:2023-04-06

    发明人: 康珊伟

    摘要: 本发明提供了一种数据仓库的数据质量校验系统及校验方法,包括:ODBC配置模块,用于对不同的数据仓库配置不同的ODBC数据驱动,连接不同的数据仓库;校验表生成模块,用于配置数据仓库的库表,生成校验表;预警表生成模块,用于配置数据仓库的库表,生成预警表;数据校验引擎,用于调用所述校验表,并生成数据质量监控表;元数据单元,用于存储校验表、预警表,以及数据质量监控表;数据预警引擎,用于调用预警表和数据质量监控表,并关联预警表中待校验的库表和数据质量监控表中待校验的库表,对待校验的库表进行校验。本发明能够第一时间获取具体某库表数据不一致问题,提高数据处理的效率。

    一种洗牌数据处理方法、装置、设备及存储介质

    公开(公告)号:CN116610488A

    公开(公告)日:2023-08-18

    申请号:CN202310511889.9

    申请日:2023-05-08

    发明人: 陈帅

    IPC分类号: G06F11/14

    摘要: 本发明公开了一种洗牌数据处理方法、装置、设备及存储介质,该方法包括:映射器将洗牌数据推送至指定工作节点;所述指定工作节点将所述洗牌数据进行合并处理,合并处理完成后将所述洗牌数据复制到与其他工作节点中;每经过预设时间间隔,所述指定工作节点则将合并处理的所述洗牌数据刷新到磁盘中,供需要时读取。本发明中指定的工作节点在接收到映射器推送的洗牌数据后,先对洗牌数据进行合并处理,然后将洗牌数据同步到其他工作节点中,并定时将洗牌数据刷新到磁盘中,从而实现数据的存储备份,提高了数据的可靠性,一定程度上有效避免了因故障存储导致需重新计算该存储中全部洗牌数据的问题,降低了洗牌数据的处理成本。

    一种基于海豚调度的数据仓库的数据质量校验系统及方法

    公开(公告)号:CN116578553A

    公开(公告)日:2023-08-11

    申请号:CN202310506173.X

    申请日:2023-05-06

    发明人: 康珊伟

    IPC分类号: G06F16/215 G06F16/28

    摘要: 本发明提供了一种基于海豚调度的数据仓库的数据质量校验系统,包括:数据质量可视化编辑模块、工作流生成模块和海豚调度模块:数据质量可视化编辑模块包括数据源配置模块和数据质量定义模块;数据源配置模块,用于连接不同的数据源,获取待校验数据;数据质量定义模块,用于创建数据质量校验脚本,配置数据质量校验规则,并基于创建的数据质量校验脚本将待校验数据生成Json格式文件;工作流生成模块,用于生成工作流。本发明基于创建的数据质量校验脚本将待校验数据生成Json格式文件,通过工作流生成模板生成工作流,海豚调度模块调度任务执行完成后自动校验数据的完整性、准确性、一致性。

    一种适于Android APP的热更新方法及系统

    公开(公告)号:CN116521196A

    公开(公告)日:2023-08-01

    申请号:CN202310383991.5

    申请日:2023-04-11

    发明人: 沈健

    IPC分类号: G06F8/65 G06F9/445 G06F8/41

    摘要: 本发明提供了一种适于Android APP的热更新方法及系统,包括如下方法步骤:更新包中代码化编译配置文件的内容;更新包以动态下发的方式下发至用户端;用户端的主包反射运行所述更新包的配置文件,获取配置文件的内容。本发明在更新包中将配置文件的内容进行代码化编译,更新包以动态下发的方式下发至用户端,用户端的主包反射运行更新包的配置文件,获取配置文件的内容,无需通过系统接口获取获取配置文件的内容,极大的提高了Android项目热更新过程中,更新包加载的速度,避免加载更新包的耗时操作,提升加载速度。

    基于聚类的用户个性化热门计算方法、装置、设备及介质

    公开(公告)号:CN114896491B

    公开(公告)日:2023-06-06

    申请号:CN202210404599.X

    申请日:2022-04-18

    发明人: 李多海

    摘要: 本申请公开了基于聚类的用户个性化热门计算方法、装置、设备及介质,所述方法包括:基于用户行为序列数据构建物品网络图;使用Graph Embedding得到各物品节点的向量表示;对物品节点的向量数据进行聚类,生成K个类簇;计算各类簇下每个物品的CTR点击率,并降序排列得到各类簇下对应的K个热门物品列表,组成Map1;计算用户对各类簇的偏好得分;根据用户对各类簇的偏好得分,对用户的每个类簇分别至Map1中对应的各热门列表中截取头部数值N个,得到1~K个不同的截取热门列表;将多个截取热门列表进行合并,再随机打散,得到用户个性化热门推荐结果。本申请基于用户行为序列,实现了精准的用户个性化热门推荐。

    基于文本标签计算文本相似度的方法及装置

    公开(公告)号:CN116186582A

    公开(公告)日:2023-05-30

    申请号:CN202310093805.4

    申请日:2023-02-10

    发明人: 胡银银

    摘要: 本申请公开了基于文本标签计算文本相似度的方法及装置,将字符串形式的文本标签先转换成转表的列形式,通过笛卡尔积方式获取每个文本与所有文本两两对应关系,并通过标签关联进行筛选,再设置标签权重值,基于标签权重值计算文本之间的相似度,并进行归一化处理。本发明通过文本标签来计算两个文本之间的相似度,具有计算效率高和准确率高的特点,通过文本标签计算文本相似度的方法较相关技术中向量计算相似度的方式,大大降低了计算资源使用量和计算资源使用时长。