实时应用场景下的神经网络切片部署方法、系统

    公开(公告)号:CN116664555B

    公开(公告)日:2024-02-06

    申请号:CN202310920521.8

    申请日:2023-07-26

    发明人: 高熙和 张磊

    摘要: 本发明公开了一种实时应用场景下的神经网络切片部署方法、系统,对视频流当前帧的各切片进行切片帧补全,得到每个切片的补全帧,在各切片的补全帧上进行神经网络推理,推理完成后抽取当前切片的分析结果。本发明主要是应用于基于神经网络的场景分析,比如显著区域检测,图像分割等任务,并使用自信息,帧间信息,帧内信息对切片进行补全,补全后应用神经网络进行图像分析,然后抽取分析后的结果,以支持后续的实时后处理和编码流程,解决了实时神经网络部署中帧信息不完整的问题。

    用于视频处理的方法、装置、系统、设备和介质

    公开(公告)号:CN116229337B

    公开(公告)日:2023-09-26

    申请号:CN202310521076.8

    申请日:2023-05-10

    发明人: 高熙和 张磊

    IPC分类号: G06V20/40 G06V10/26 G06V10/82

    摘要: 本公开提供一种用于视频处理的方法、装置、系统、设备和介质。实现的方案为:基于第一预设规则,在待处理视频中确定目标帧和与目标帧对应的相关帧,其中,相关帧包括在目标帧中出现的至少一个目标对象;对相关帧进行分割,以得到第一分割结果;基于第一分割结果获取与相关帧对应的第一掩膜帧,其中,第一掩膜帧包括与至少一个目标对象对应的第一目标区域,并且第一目标区域中每一个像素的像素值指示相关帧中位置对应的像素属于至少一个目标对象;以及将待处理视频的相关帧替换为对应的第一掩膜帧。

    用于视频处理的方法、装置、系统、设备和介质

    公开(公告)号:CN117152658B

    公开(公告)日:2024-10-01

    申请号:CN202311095385.X

    申请日:2023-05-10

    发明人: 高熙和 张磊

    摘要: 本公开提供一种用于视频处理的方法、装置、系统、设备和介质。实现的方案为:基于第一预设规则,在待处理视频中确定目标帧和与目标帧对应的相关帧,其中,相关帧包括在目标帧中出现的至少一个目标对象;对相关帧进行分割,以得到第一分割结果;基于第一分割结果获取与相关帧对应的第一掩膜帧,其中,第一掩膜帧包括与至少一个目标对象对应的第一目标区域,并且第一目标区域中每一个像素的像素值指示相关帧中位置对应的像素属于至少一个目标对象;以及将待处理视频的相关帧替换为对应的第一掩膜帧。

    视频处理方法、系统、计算机设备及计算机可读存储介质

    公开(公告)号:CN116761019A

    公开(公告)日:2023-09-15

    申请号:CN202311071849.3

    申请日:2023-08-24

    摘要: 本公开提供了一种视频处理方法、系统、计算机设备及计算机可读存储介质。实现方案为:在云端设备处:获取待传输的视频文件的多个图像帧;确定多个图像帧中是否包括目标图像帧;响应于确定多个图像帧中包括目标图像帧,生成与目标图像帧相关的云端分析信息;基于云端分析信息和多个图像帧生成待处理视频文件;以及在终端设备处:获取待处理视频文件;基于待处理视频文件所携带的云端分析信息,获取多个图像帧中的目标图像帧以及除此之外的其他图像帧;对多个图像帧中的目标图像帧应用针对目标场景的第一图像处理操作或者针对目标图像内容的第二图像处理操作中的至少一者,以得到经处理的多个图像帧;基于经处理的多个图像帧生成经处理的视频文件。

    视觉数据处理方法、装置、计算机设备及可读存储介质

    公开(公告)号:CN116501217B

    公开(公告)日:2023-09-05

    申请号:CN202310758944.4

    申请日:2023-06-26

    发明人: 高熙和 张浩 张磊

    摘要: 本公开提供了一种视觉数据处理方法、装置、计算机设备及可读存储介质。方法包括:获取待处理视觉数据;将待处理视觉数据风格化以获得基底风格视觉数据;对基底风格视觉数据进行风格上的调整以生成多个候选风格视觉数据在交互界面上展示;基于用户对多个候选风格视觉数据的选择,确定与用户感兴趣的风格相关联的预测性风格化参数;执行至少一次循环:对预测性风格化参数添加修正项以生成多组经修正的预测性风格化参数;基于多组经修正的预测性风格化参数,生成修正的候选风格视觉数据在交互界面上展示;响应于用户指示结束交互操作,基于用户的当前选择,获得符合用户感兴趣的风格的视觉数据;响应于用户未指示结束交互操作,执行下一次循环。

    实时应用场景下的神经网络切片部署方法、系统

    公开(公告)号:CN116664555A

    公开(公告)日:2023-08-29

    申请号:CN202310920521.8

    申请日:2023-07-26

    发明人: 高熙和 张磊

    摘要: 本发明公开了一种实时应用场景下的神经网络切片部署方法、系统,对视频流当前帧的各切片进行切片帧补全,得到每个切片的补全帧,在各切片的补全帧上进行神经网络推理,推理完成后抽取当前切片的分析结果。本发明主要是应用于基于神经网络的场景分析,比如显著区域检测,图像分割等任务,并使用自信息,帧间信息,帧内信息对切片进行补全,补全后应用神经网络进行图像分析,然后抽取分析后的结果,以支持后续的实时后处理和编码流程,解决了实时神经网络部署中帧信息不完整的问题。

    视觉数据处理方法、装置、计算机设备及可读存储介质

    公开(公告)号:CN116501217A

    公开(公告)日:2023-07-28

    申请号:CN202310758944.4

    申请日:2023-06-26

    发明人: 高熙和 张浩 张磊

    摘要: 本公开提供了一种视觉数据处理方法、装置、计算机设备及可读存储介质。方法包括:获取待处理视觉数据;将待处理视觉数据风格化以获得基底风格视觉数据;对基底风格视觉数据进行风格上的调整以生成多个候选风格视觉数据在交互界面上展示;基于用户对多个候选风格视觉数据的选择,确定与用户感兴趣的风格相关联的预测性风格化参数;执行至少一次循环:对预测性风格化参数添加修正项以生成多组经修正的预测性风格化参数;基于多组经修正的预测性风格化参数,生成修正的候选风格视觉数据在交互界面上展示;响应于用户指示结束交互操作,基于用户的当前选择,获得符合用户感兴趣的风格的视觉数据;响应于用户未指示结束交互操作,执行下一次循环。

    用于视频处理的方法、装置、系统、设备和介质

    公开(公告)号:CN116229337A

    公开(公告)日:2023-06-06

    申请号:CN202310521076.8

    申请日:2023-05-10

    发明人: 高熙和 张磊

    IPC分类号: G06V20/40 G06V10/26 G06V10/82

    摘要: 本公开提供一种用于视频处理的方法、装置、系统、设备和介质。实现的方案为:基于第一预设规则,在待处理视频中确定目标帧和与目标帧对应的相关帧,其中,相关帧包括在目标帧中出现的至少一个目标对象;对相关帧进行分割,以得到第一分割结果;基于第一分割结果获取与相关帧对应的第一掩膜帧,其中,第一掩膜帧包括与至少一个目标对象对应的第一目标区域,并且第一目标区域中每一个像素的像素值指示相关帧中位置对应的像素属于至少一个目标对象;以及将待处理视频的相关帧替换为对应的第一掩膜帧。

    用于视频处理的方法、装置、系统、设备和介质

    公开(公告)号:CN117152658A

    公开(公告)日:2023-12-01

    申请号:CN202311095385.X

    申请日:2023-05-10

    发明人: 高熙和 张磊

    摘要: 本公开提供一种用于视频处理的方法、装置、系统、设备和介质。实现的方案为:基于第一预设规则,在待处理视频中确定目标帧和与目标帧对应的相关帧,其中,相关帧包括在目标帧中出现的至少一个目标对象;对相关帧进行分割,以得到第一分割结果;基于第一分割结果获取与相关帧对应的第一掩膜帧,其中,第一掩膜帧包括与至少一个目标对象对应的第一目标区域,并且第一目标区域中每一个像素的像素值指示相关帧中位置对应的像素属于至少一个目标对象;以及将待处理视频的相关帧替换为对应的第一掩膜帧。

    基于自编码器的图像压缩方法和装置

    公开(公告)号:CN116939210B

    公开(公告)日:2023-11-17

    申请号:CN202311175833.7

    申请日:2023-09-13

    发明人: 张浩 高熙和 张磊

    摘要: 本发明提供了一种基于自编码器的图像压缩方法和装置。其中,该方法包括切割待处理图像为多个区域图块并依次输入至预先训练好的自编码器中,获得多个区域图块的图块纹理特征并进行维度合并,得到压缩纹理特征集;选定当前查找表并对将压缩纹理特征集进行最邻近查找,获得最邻近查找结果集后再进行维度拆分,得到与每个区域图块的图块纹理特征最邻近的最邻近纹理特征;将每个区域图块的最邻近纹理特征输入至预先训练好的解码器中获得多个最邻近区域图块并进行拼接获得输出图像。本发明的技术方案能够提取人眼感知不到的纹理特征,既提高压缩率又节省人工,而且具有用户可调的码率控制功能。