数据血缘的处理方法及装置

    公开(公告)号:CN111538744A

    公开(公告)日:2020-08-14

    申请号:CN202010650668.6

    申请日:2020-07-08

    IPC分类号: G06F16/242 G06F16/2455

    摘要: 本发明提供了一种数据血缘的处理方法及装置,其中所述方法包括:通过遍历目标抽象语法树生成第一抽象语法树;根据所述第一抽象语法树中包括的第二抽象语法树生成与所述第二抽象语法树对应的目标数据表;根据所述第一抽象语法树中包括的第三抽象语法树生成与所述第三抽象语法树对应的目标字段;根据所述目标数据表和所述目标字段组成的关系链,确定数据的血缘关系。通过本发明,解决了在数据血缘分析结果中没有数据结构进行保存和无法提前进行数据血缘分析的问题,进而达到了分析结果保存在自定义的可扩展的数据结构的效果。

    数据血缘的处理方法及装置

    公开(公告)号:CN111538744B

    公开(公告)日:2020-11-06

    申请号:CN202010650668.6

    申请日:2020-07-08

    IPC分类号: G06F16/242 G06F16/2455

    摘要: 本发明提供了一种数据血缘的处理方法及装置,其中所述方法包括:通过遍历目标抽象语法树生成第一抽象语法树;根据所述第一抽象语法树中包括的第二抽象语法树生成与所述第二抽象语法树对应的目标数据表;根据所述第一抽象语法树中包括的第三抽象语法树生成与所述第三抽象语法树对应的目标字段;根据所述目标数据表和所述目标字段组成的关系链,确定数据的血缘关系。通过本发明,解决了在数据血缘分析结果中没有数据结构进行保存和无法提前进行数据血缘分析的问题,进而达到了分析结果保存在自定义的可扩展的数据结构的效果。

    实时任务的处理方法和装置、存储介质及电子装置

    公开(公告)号:CN113504912B

    公开(公告)日:2024-06-18

    申请号:CN202110833273.4

    申请日:2021-07-22

    IPC分类号: G06F8/41 G06F11/36

    摘要: 本申请公开了一种实时任务的调试方法和装置、存储介质、电子装置,其中,上述方法包括:响应于针对目标实时任务进行调度的调试指令,对目标实时任务进行解析,得到所述目标实时任务所使用的任务数据源表;获取与所述任务数据源表对应的任务数据源文件,其中,所述任务数据源文件包含与所述任务数据源表对应的目标调试数据,所述目标调试数据用于替换所述任务数据源表对所述目标实时任务进行调试;使用所述目标调试数据对所述目标实时任务进行调试,得到所述目标实时任务的目标调试结果。通过本申请,解决了相关技术中实时任务的调试方法存在需要预定义文件格式导致的调试操作的复杂度高、任务调试的便捷性差的问题。

    一种任务调度方法及装置
    4.
    发明公开

    公开(公告)号:CN113886040A

    公开(公告)日:2022-01-04

    申请号:CN202111122183.0

    申请日:2021-09-24

    IPC分类号: G06F9/48 G06F16/22

    摘要: 本发明公开了一种任务调度方法及装置,该方法应用于任务调度系统,包括:对各个项目对应的目标调度资源中各个任务执行定时触发,将所述各个任务定时触发后所对应的执行信息生成执行记录,并将所述执行记录记录于数据库中本地消息列表;查询所述本地消息列表中各个任务对应的执行状态信息,得到查询结果;当基于查询结果确定所述本地消息列表中存在待下发的任务时,将所述待下发的任务发布到所述各个项目对应的同名消息队列中;当确定所述待下发的任务已发布至所述同名消息队列,将所述执行记录中所述待下发的任务的执行状态更新为已下发,以及,当确定所述本地消息列表中的所有任务的执行状态更新为已下发,则确定任务调度完成。

    自定义函数的分类方法和装置、存储介质及电子装置

    公开(公告)号:CN115858054A

    公开(公告)日:2023-03-28

    申请号:CN202211738010.6

    申请日:2022-12-30

    IPC分类号: G06F9/448

    摘要: 本申请公开了一种自定义函数的分类方法和装置、存储介质、电子装置,上述方法包括:确定目标对象发送的文件路径信息对应的所有类文件,其中,所述类文件用于存储自定义函数;创建与所述所有类文件对应的类加载器,并通过所述类加载器分别为所述所有类文件创建对象实体;根据预设关键字对所述对象实体和所述所有类文件中存储的自定义函数进行分类;采用上述方案,解决了相关技术中,用户使用Flink自定义函数之后,对于自定义函数的注册、定义使用,均需要用户明确知道函数的类路径,用户体验差的问题。

    一种应用于分布式流数据流引擎的资源设置方法及装置

    公开(公告)号:CN114153574A

    公开(公告)日:2022-03-08

    申请号:CN202111298103.7

    申请日:2021-11-04

    IPC分类号: G06F9/48 G06F9/50

    摘要: 本发明实施例提供一种应用于分布式流数据流引擎的资源设置方法及装置。该方法包括:基于接收的待处理任务,生成待处理任务的逻辑流图;从算子资源配置中获取逻辑流图中各流节点的资源信息;将逻辑流图中具有相同的设定属性的流节点合并为组节点,得到具有各组节点的资源信息的逻辑组图;将逻辑组图提交至资源调度器。通过设置算子资源配置,可以简便快捷地对任务的算子所需的资源进行细粒度的资源设置,同时,每次算子资源配置更新后,逻辑流图中各流节点的资源信息也会相应的更新。那么就可实现方便地对逻辑流图中各流节点的资源信息根据需要进行设置,如此,可以实现对各流节点、组节点的资源信息进行灵活的调控。提高了资源设置的效率。

    一种业务数据的批处理方法、装置、电子设备及存储介质

    公开(公告)号:CN118332003A

    公开(公告)日:2024-07-12

    申请号:CN202410483273.X

    申请日:2024-04-22

    摘要: 本申请公开一种业务数据的批处理方法、装置、电子设备及存储介质,属于大数据技术领域,该方法中,SQL引擎若确定获取的SQL语句中包含的UDF是微批函数,则获取UDF的批大小,基于批大小创建队列,之后,将获取的待UDF处理的业务数据逐条写入队列,直至满足批处理条件时,从外部服务批量获取UDF处理队列中各业务数据所需的外部数据,然后,再利用UDF对队列中的各业务数据和外部数据进行处理,得到队列中的各业务数据的批处理结果。这样,借助于队列进行赞批,赞批不必用户实现,用户在开发UDF时,只需指定批量调用逻辑,既可有效降低与外部服务的交互频率,提升整体吞吐量,还能降低开发难度、降低运维难度。

    实时任务的处理方法和装置、存储介质及电子装置

    公开(公告)号:CN113504912A

    公开(公告)日:2021-10-15

    申请号:CN202110833273.4

    申请日:2021-07-22

    IPC分类号: G06F8/41 G06F11/36

    摘要: 本申请公开了一种实时任务的调试方法和装置、存储介质、电子装置,其中,上述方法包括:响应于针对目标实时任务进行调度的调试指令,对目标实时任务进行解析,得到所述目标实时任务所使用的任务数据源表;获取与所述任务数据源表对应的任务数据源文件,其中,所述任务数据源文件包含与所述任务数据源表对应的目标调试数据,所述目标调试数据用于替换所述任务数据源表对所述目标实时任务进行调试;使用所述目标调试数据对所述目标实时任务进行调试,得到所述目标实时任务的目标调试结果。通过本申请,解决了相关技术中实时任务的调试方法存在需要预定义文件格式导致的调试操作的复杂度高、任务调试的便捷性差的问题。