用于数字图像处理的方法和装置

    公开(公告)号:CN100514363C

    公开(公告)日:2009-07-15

    申请号:CN01806579.1

    申请日:2001-02-23

    申请人: 英特尔公司

    IPC分类号: G06T5/00

    摘要: 在一些实施例中,本发明包括接收包括文本和背景的数字图像。该方法包括:矢量量化数字图像以使数字图像被划分为某些颜色,并由文本的一部分和背景的第一部分生成文本颜色直方图。本方法也包括:由背景的第二部分生成背景颜色直方图,并由文本颜色直方图与至少一个背景颜色直方图之间的差异生成差异颜色直方图,其中,从差异颜色直方图得到估计的文本颜色。在其他实施例中,本发明包括接收包括视频信号中多个帧的限定框的文本对象。此外,该方法包括:估计该限定框的文本的颜色和通过最佳位移搜索来校准表示限定框的块,该位移搜索中只有含有在所估计的颜色阈值之内的颜色的像素被考虑。本发明的一些实施例也包括:接收文本限定框中的数字图像和在分割处理中将数字图像的大小调整为一个固定高度。

    估计文本颜色和图像的分割

    公开(公告)号:CN1419679A

    公开(公告)日:2003-05-21

    申请号:CN01806579.1

    申请日:2001-02-23

    申请人: 英特尔公司

    IPC分类号: G06T5/00

    摘要: 在一些实施例中,本发明包括接收包括文本和背景的数字图像。该方法包括:矢量量化数字图像以使数字图像被划分为某些颜色,并由文本的一部分和背景的第一部分生成文本颜色直方图。本方法也包括:由背景的第二部分生成背景颜色直方图,并由文本颜色直方图与至少一个背景颜色直方图之间的差异生成差异颜色直方图,其中,从差异颜色直方图得到估计的文本颜色。在其他实施例中,本发明包括接收包括视频信号中多个帧的限定框的文本对象。此外,该方法包括:估计该限定框的文本的颜色和通过最佳位移搜索来校准表示限定框的块,该位移搜索中只有含有在所估计的颜色阈值之内的颜色的像素被考虑。本发明的一些实施例也包括:接收文本限定框中的数字图像和在分割处理中将数字图像的大小调整为一个固定高度。

    在数字图像中定位文本的方法和装置

    公开(公告)号:CN100514364C

    公开(公告)日:2009-07-15

    申请号:CN01806580.5

    申请日:2001-02-23

    申请人: 英特尔公司

    IPC分类号: G06T5/00

    摘要: 在一些实施例中,本发明包括一种在数字图像中定位文本的方法。该方法包括:将一个数字图像按比例变换为多种分辨率的若干个图像,和按照像素是否是一个文本区域的一部分来对所述多种分辨率下的像素进行分类。该方法还包括:将各比例进行整合以生成一个比例整合突出图形,和使用该突出图形来生成初始文本界定方框,这是通过将方框从包括至少一个像素的像素矩形扩展成包括由至少一个与所述矩形邻接的像素构成的组来完成的,其中这些组与第一阈值之间具有特定关系。将初始文本界定方框合并。在其他实施例中,一种方法包括:按照像素是否是文本区的一部分来对像素进行分类,生成初始文本界定方框,和合并初始文本界定方框,其中所述合并包括生成具有自适应阈值的水平投影轮廓和具有自适应阈值的垂直投影轮廓。

    通用的图像中的文本定位

    公开(公告)号:CN1418354A

    公开(公告)日:2003-05-14

    申请号:CN01806580.5

    申请日:2001-02-23

    申请人: 英特尔公司

    IPC分类号: G06T5/00

    摘要: 在一些实施例中,本发明包括一种在数字图像中定位文本的方法。该方法包括:将一个数字图像按比例变换为多种分辨率的若干个图像,和按照像素是否是一个文本区域的一部分来对所述多种分辨率下的像素进行分类。该方法还包括:将各比例进行整合以生成一个比例整合突出图形,和使用该突出图形来生成初始文本界定方框,这是通过将方框从包括至少一个像素的像素矩形扩展成包括由至少一个与所述矩形邻接的像素构成的组来完成的,其中这些组与第一阈值之间具有特定关系。将初始文本界定方框合并。在其他实施例中,一种方法包括:按照像素是否是文本区的一部分来对像素进行分类,生成初始文本界定方框,和合并初始文本界定方框,其中所述合并包括生成具有自适应阈值的水平投影轮廓和具有自适应阈值的垂直投影轮廓。