-
公开(公告)号:CN102208025A
公开(公告)日:2011-10-05
申请号:CN201110140399.X
申请日:2011-05-27
申请人: 中国科学院自动化研究所
IPC分类号: G06K9/32
摘要: 本发明提供一种文本图像几何畸变的矫正方法包括提取文本图像中水平方向的文本行并利用B样条曲线对其进行拟合,得到文本行曲线;利用文本行曲线的切线会聚对称性估计柱面直母线的灭点、文本行切线会聚线及相机的焦距参数;对拟合的文本行曲线,采用交比插值构造等距网格的纬线;利用文本行曲线的类透视投影变换,估计柱面的准线,构造等距网格的经线;利用图像顶端和底端的文本行曲线,估计得到等距网格的长宽比;通过基于网格的形变技术,将每一个等距网格的网孔映射为一正方形网格,完成文本图像几何畸变的矫正。本发明解决现有技术无法同时矫正透视失真、非线性形变失真以及二者的复合失真等难题,可实现相机拍摄文本图像几何畸变的完全矫正。
-
公开(公告)号:CN102156884A
公开(公告)日:2011-08-17
申请号:CN201110103720.7
申请日:2011-04-25
申请人: 中国科学院自动化研究所
IPC分类号: G06K9/62
摘要: 本发明提供一种直线段检测和提取方法,所述方法包括步骤S1:对一幅扫描二值图像,计算二值图像像素点周围的游长直方图,并提取对应的游长方向与长度特征;步骤S2:对二值图像上每个前景像素点,构造一个圆弧形邻域结构,并利用像素点周围的游长特征进行局部直线段的检测;步骤S3:对检测到的局部直线段进行聚类合并,得到具有全局意义的长直线段。与传统方法相比,该技术仅需设置待检测直线段的最小长度,可有效的避免传统直线段检测方法中存在的虚检和漏检。本发明应用于票据图像中图形目标的自动检测和提取,在图形矢量化、表格分析、银行票据自动处理等领域有着广阔的应用前景。
-
公开(公告)号:CN118279590A
公开(公告)日:2024-07-02
申请号:CN202410450421.8
申请日:2024-04-15
申请人: 中国科学院自动化研究所
IPC分类号: G06V10/26 , G06V10/774 , G06V10/82 , G06V20/70 , G06V10/28 , G06N3/0455 , G06N3/084 , G06N3/0895
摘要: 本发明提供一种半监督的红外图像分割方法,包括:搭建图像分割子网络,该图像分割子网络以红外图像作为输入,提取特征,并将特征变换为像素级的类别预测;搭建辅助分割子网络,该辅助分割子网络直接使用预训练的SAM构建,以无标注的红外图像以及提示信息作为输入,预测伪标签;训练红外图像分割网络,在少量的有标注数据以及较多的无标注数据上定义整体优化目标,并通过梯度下降算法优化红外图像分割网络参数;所述红外图像分割网络包括步骤1的图像分割子网络和步骤2的辅助分割子网络;评估红外图像分割网络效果,在测试集上对每一张红外图像进行推理,并根据真实标注信息计算分割精度。本发明提供能够节约数据标注的成本。
-
公开(公告)号:CN110210574B
公开(公告)日:2022-02-18
申请号:CN201910510470.5
申请日:2019-06-13
申请人: 中国科学院自动化研究所
IPC分类号: G06V20/10 , G06V10/774 , G06V10/762 , G06V10/764 , G06V10/82 , G06V10/80 , G06K9/62
摘要: 本发明涉及图像处理领域,具体涉及一种合成孔径雷达图像解译方法、目标识别装置及设备,旨在解决合成孔径雷达图像解译性能不高的问题,本发明方法包括利用合成孔径雷达训练图像和光学训练图像来获取合成孔径雷达图像的解译模型;以及基于所述解译模型进行图像解译或目标识别。本发明提高了SAR图像解译性能。
-
公开(公告)号:CN109785396B
公开(公告)日:2021-09-28
申请号:CN201910064158.8
申请日:2019-01-23
申请人: 中国科学院自动化研究所
摘要: 本发明属于计算机视觉技术领域,具体涉及了一种基于双目相机的写字姿态监测方法、系统、装置,旨在解决传统方法只能单一监测眼睛和课桌的距离,无法在不影响书写体验的前提下监测其他错误写字姿态的问题。本发明方法包括:获取双目相机采集的坐姿图像对;采用姿态估计网络进行二维姿态估计,获得二维骨架点位置;依据坐姿图像对,采用双目重建技术进行坐姿三维表面重建,并结合所述二维骨架点位置获得三维骨架点位置;基于预设的骨架点状态‑姿态类别对应关系,获得坐姿图像对所属姿态类别。本发明方法可以详细分析使用者的多种写字姿态,并且不影响使用者的书写体验。
-
公开(公告)号:CN112434674A
公开(公告)日:2021-03-02
申请号:CN202110098072.4
申请日:2021-01-25
申请人: 中国科学院自动化研究所
摘要: 本发明属于视觉检测和图像处理领域,具体涉及了一种基于标注框虚拟扩增的微小人脸检测方法、系统、装置,旨在解决模型训练中仅有少量的微小人脸特征图区域被定义为正,从而导致模型对于微小人脸的检测精度和准确性较低的问题。本发明包括:使用矩形框标注微小人脸;基于LFFD构建人脸检测模型;以模型针对小尺度人脸检测分支的特征图下采样倍数为依据,进行矩形框的虚拟扩增;分别基于矩形框和虚拟扩增框生成模型的分类和预测目标;通过反向传播和随机梯度下降法迭代进行模型训练;通过训练后的同时检测通常大小人脸和微小人脸的模型进行在线人脸检测。本发明将标注框虚拟扩增应用于微小人脸数据,提升微小人脸的检出率,实现了微小人脸检测。
-
公开(公告)号:CN112017436A
公开(公告)日:2020-12-01
申请号:CN202010940567.2
申请日:2020-09-09
申请人: 中国科学院自动化研究所
摘要: 本发明涉及一种城市市内交通旅行时间的预测方法及系统,所述预测方法包括将待测城市划分为矩形网格;基于矩形网格,根据历史交通流量数据构建归一化浮点交通流量矩阵;根据归一化浮点交通流量矩阵,训练城市市内交通流量预测网络;根据矩形网格对车辆行驶路径的轨迹点序列进行简化处理,得到车辆行驶路径的网格化轨迹;根据归一化浮点交通流量矩阵及网格化轨迹,确定网格化轨迹中各轨迹点的特征向量;根据各轨迹点的特征向量,训练城市市内交通旅行时间预测网络;基于城市市内交通流量预测网络和城市市内旅行时间预测网络,根据待测车辆的待测行驶路径,可准确确定所述待测车辆行驶完所述待测路径所需要的旅行时间,可提高复杂场景下预测精度。
-
公开(公告)号:CN110210574A
公开(公告)日:2019-09-06
申请号:CN201910510470.5
申请日:2019-06-13
申请人: 中国科学院自动化研究所
摘要: 本发明涉及图像处理领域,具体涉及一种合成孔径雷达图像解译方法、目标识别装置及设备,旨在解决合成孔径雷达图像解译性能不高的问题,本发明方法包括利用合成孔径雷达训练图像和光学训练图像来获取合成孔径雷达图像的解译模型;以及基于所述解译模型进行图像解译或目标识别。本发明提高了SAR图像解译性能。
-
公开(公告)号:CN108960230A
公开(公告)日:2018-12-07
申请号:CN201810549254.7
申请日:2018-05-31
申请人: 中国科学院自动化研究所
CPC分类号: G06K9/3233 , G06K9/6256 , G06K9/6267
摘要: 本发明属于图像分析技术领域,具体提供了一种基于旋转区域的轻量化目标识别方法及装置。旨在解决现有技术目标识别算法复杂度高以及难以识别多个角度目标的问题。本发明提供了一种基于旋转矩形框的轻量化目标识别方法,包括基于预先构建的目标识别网络模型对输入图像进行目标识别,得到输入图像的目标类别。目标识别网络模型基于卷积神经网络构建,包括目标提取模块和目标识别模块。本发明通过合并压缩现有的卷积神经网络,减少了网络参数,降低了算法复杂度。
-
公开(公告)号:CN105469369A
公开(公告)日:2016-04-06
申请号:CN201510872635.5
申请日:2015-11-27
申请人: 中国科学院自动化研究所
IPC分类号: G06T5/00
CPC分类号: G06T5/002 , G06T2207/10004 , G06T2207/20021 , G06T2207/20192
摘要: 本发明公开了一种基于分割图的数字图像滤波方法和系统,其中,该方法包括步骤1:获取数字图像的超像素分割块;步骤2:在超像素分割块内进行聚合运算;步骤3:进行相邻超像素分割块之间的聚合运算;步骤4:计算相邻超像素分割块之间的加权平均。其中,步骤2具体包括:从超像素分割块内提取出最小生成树,并沿着最小生成树,在超像素分割块内进行聚合运算。步骤4具体包括:在数字图像上选定一窗口,根据窗口覆盖超像素分割块的面积,来计算超像素分割块间加权平均的权重,并对步骤3所得的结果进行加权平均。通过本发明,至少部分地解决了如何抑制纹理的技术问题。
-
-
-
-
-
-
-
-
-