一种图像对单应性矩阵的预测方法及装置

    公开(公告)号:CN118967432A

    公开(公告)日:2024-11-15

    申请号:CN202411462971.8

    申请日:2024-10-20

    摘要: 本发明公开了一种图像对单应性矩阵的预测方法及装置,属于计算机视觉技术领域。所述预测方法包括:获取待预测的图像对,所述图像对包括第一图像和第二图像;利用第一方法预测第一图像变换到第二图像的第一单应性矩阵;基于第一单应性矩阵对第一图像进行变换,得到第三图像;利用第二方法预测第三图像变换到第二图像的第二单应性矩阵;基于第一单应性矩阵和第二单应性矩阵计算得到最终的单应性矩阵。本发明提高了单应性矩阵预测的准确率。

    一种碑文文字提取方法、装置、设备及介质

    公开(公告)号:CN117079263A

    公开(公告)日:2023-11-17

    申请号:CN202311336471.5

    申请日:2023-10-16

    摘要: 本发明公开了一种碑文文字提取方法、装置、设备及介质,涉及图像处理领域,其技术方案要点是:以一个U‑Net网络作为重复网络单元进行网络的堆叠,获得第二生成器,其中U‑Net网络的卷积运算是由1×1大小的卷积核和3×3大小的平均池化依次完成的;根据第一生成器和第一判决器构成第一组生成对抗网络,根据第二生成器和第二判决器构成第二组生成对抗网络,依据两组生成对抗网络对第一生成器和第二生成器进行交叉训练,在训练次数达到预定次数时,得到对碑文图片的前景与背景具有分割提取能力的第二生成器,其中第二生成器的末位U‑Net网络为第一生成器。本发明解决了现有技术无法有效提取具有高度自相似前景与背景特征的碑文的问题。

    一种智能消防炮控制灭火方法及控制系统

    公开(公告)号:CN113705539A

    公开(公告)日:2021-11-26

    申请号:CN202111148263.3

    申请日:2021-09-29

    发明人: 张攀 李超 吴国成

    摘要: 本发明公开了一种智能消防炮控制灭火方法及控制系统。基于可见光图片采集方位生成第一矩阵,利用深度学习目标检测定位算法判别其中可燃烧物区域及灭火剂种类,并生成第二矩阵;基于第二矩阵结合狄克斯特拉算法,获取消防炮遍历潜在火灾区域的最短路径;若发生火灾,消防炮按照最短路径进行旋转,并获取对应热红外图片,定位发生火灾的位置;结合匹配的灭火剂种类,利用深度强化学习控制消防炮调整方位执行灭火。本发明的有益效果为,在火灾未发生前生成遍历潜在火灾区域的最短路径,使得消防炮旋转变得高效;消防炮可根据可燃烧物种类选择对应的灭火剂灭火;深度强化学习结合热红外图像,使得灭火过程更加精细,避免了灭火剂对非燃烧区域的污染。

    一种碑文文字提取方法、装置、设备及介质

    公开(公告)号:CN117079263B

    公开(公告)日:2024-01-02

    申请号:CN202311336471.5

    申请日:2023-10-16

    摘要: 本发明公开了一种碑文文字提取方法、装置、设备及介质,涉及图像处理领域,其技术方案要点是:以一个U‑Net网络作为重复网络单元进行网络的堆叠,获得第二生成器,其中U‑Net网络的卷积运算是由1×1大小的卷积核和3×3大小的平均池化依次完成的;根据第一生成器和第一判决器构成第一组生成对抗网络,根据第二生成器和第二判决器构成第二组生成对抗网络,依据两组生成对抗网络对第一生成器和第二生成器进行交叉训练,在训练次数达到预定次数时,得到对碑文图片的前景与背景具有分割提取能力的第二生成器,其中第二生成器的末位U‑Net网络为第一生成器。本发明解决了现有技术无法有效提取具有高度自相似前景与背景特征的碑文的问题。

    一种智能消防炮控制灭火方法及控制系统

    公开(公告)号:CN113705539B

    公开(公告)日:2023-05-05

    申请号:CN202111148263.3

    申请日:2021-09-29

    发明人: 张攀 李超 吴国成

    摘要: 本发明公开了一种智能消防炮控制灭火方法及控制系统。基于可见光图片采集方位生成第一矩阵,利用深度学习目标检测定位算法判别其中可燃烧物区域及灭火剂种类,并生成第二矩阵;基于第二矩阵结合狄克斯特拉算法,获取消防炮遍历潜在火灾区域的最短路径;若发生火灾,消防炮按照最短路径进行旋转,并获取对应热红外图片,定位发生火灾的位置;结合匹配的灭火剂种类,利用深度强化学习控制消防炮调整方位执行灭火。本发明的有益效果为,在火灾未发生前生成遍历潜在火灾区域的最短路径,使得消防炮旋转变得高效;消防炮可根据可燃烧物种类选择对应的灭火剂灭火;深度强化学习结合热红外图像,使得灭火过程更加精细,避免了灭火剂对非燃烧区域的污染。

    一种适用于连续帧序列单应性变换的网络模型及训练方法

    公开(公告)号:CN115661724A

    公开(公告)日:2023-01-31

    申请号:CN202211587820.6

    申请日:2022-12-12

    发明人: 张攀 颜春秀 李超

    摘要: 一种适用于连续帧序列单应性变换的网络模型及训练方法,包括如下步骤:步骤1.构建第一数据集,该数据集由视频中每帧有效图像随机进行单应性变换后形成的图像对作为数据组成;步骤2.搭建深度卷积神经网络模型,并以第一数据集完成训练;步骤3.构建第二数据集,第二数据集包括多组帧序列;步骤4.以步骤2训练完成的深度卷积神经网络模型作为循环单元,构建双向循环神经网络模型并以第二数据集进行训练,训练完成后获得适用于连续帧序列单应性变换的网络模型。本发明可在较少数据标注量的基础上,针对输入图像对内容变化可能较大场景,准确生成连续视频帧序列之间的单应性矩阵。

    一种用于辅助批量二维码解码的图像采集方法及装置

    公开(公告)号:CN117077708A

    公开(公告)日:2023-11-17

    申请号:CN202311042544.X

    申请日:2023-08-17

    IPC分类号: G06K7/14 G06N3/0442

    摘要: 本发明公开了一种用于辅助批量二维码解码的图像采集方法及装置,涉及图像采集领域,其技术方案要点是:获取相机连续采集场景区域相同角度的m‑1帧图像,其中m为正整数,且m大于等于4;将m‑1帧图像输入至预先构建并训练完成的变焦预测模型中,预测出第m帧图像中的二维码显示设备的目标轮廓信息;确定目标轮廓信息对应的缩放倍数范围,其中缩放倍数范围由缩放下限倍数与缩放上限倍数构成的;根据缩放倍数范围的交集的中心数值和当前相机的变焦范围,计算出相机采集场景区域第m帧图像的变焦倍数。本发明解决了现有技术在批量采集二维码的图像时因二维码细节信息的缺失,导致的二维码后续无法被解码的问题。

    一种适用于连续帧序列单应性变换的网络模型及训练方法

    公开(公告)号:CN115661724B

    公开(公告)日:2023-03-28

    申请号:CN202211587820.6

    申请日:2022-12-12

    发明人: 张攀 颜春秀 李超

    摘要: 一种适用于连续帧序列单应性变换的网络模型及训练方法,包括如下步骤:步骤1.构建第一数据集,该数据集由视频中每帧有效图像随机进行单应性变换后形成的图像对作为数据组成;步骤2.搭建深度卷积神经网络模型,并以第一数据集完成训练;步骤3.构建第二数据集,第二数据集包括多组帧序列;步骤4.以步骤2训练完成的深度卷积神经网络模型作为循环单元,构建双向循环神经网络模型并以第二数据集进行训练,训练完成后获得适用于连续帧序列单应性变换的网络模型。本发明可在较少数据标注量的基础上,针对输入图像对内容变化可能较大场景,准确生成连续视频帧序列之间的单应性矩阵。