基于图像内容的关键词搜索方法和装置

    公开(公告)号:CN101520783B

    公开(公告)日:2011-12-21

    申请号:CN200810080943.4

    申请日:2008-02-29

    IPC分类号: G06F17/30 G06K9/62

    摘要: 本发明提供了一种基于图像内容的关键词搜索方法和装置。该关键词搜索装置在所输入的文档图像中搜索并定位所输入的关键词,该关键词搜索装置包括:整体匹配单元,该整体匹配单元从所述文档图像中提取多个候选关键词图像区域,提取所述多个候选关键词图像区域的图像特征,将所述图像特征与所述关键词的特征进行匹配,以获得与所述多个候选关键词图像区域相对应的匹配距离;校验单元,该校验单元对匹配距离小的前N个候选关键词图像区域进行识别,计算识别候选和所述关键词之间的校验距离;过滤单元,该过滤单元计算所述匹配距离和所述校验距离的组合距离,并根据该组合距离滤除组合距离大的候选关键词图像区域。

    反射式字幕移动处理装置、方法以及程序

    公开(公告)号:CN102210162A

    公开(公告)日:2011-10-05

    申请号:CN200880131942.6

    申请日:2008-11-12

    IPC分类号: H04N21/472 H04N5/445

    摘要: 本反射式字幕移动处理装置具有:在对视频数据所包含的特定的帧图像进行了放大的放大图像中,确定属于被视为重叠地插入到背景上的字符串的部分的像素的单元;判断属于被视为字符串的部分的任意一个像素是否是放大图像内的一部分、即显示区域外的像素,在判断为属于被视为字符串的部分的任意一个像素是显示区域外的像素的情况下,算出以属于被视为字符串的部分的全部像素或者主要像素缩小到显示区域内的方式移动被视为字符串的部分时的移动量的单元;以及对于属于被视为字符串的部分的像素或者用规定的字体表示字符串的情况下属于该字符串的像素,根据移动量确定移动目的地像素,并用规定的颜色置换该移动目的地像素的颜色的单元。

    生成视频摘要的方法、装置、包含该装置的图像处理系统

    公开(公告)号:CN101887439A

    公开(公告)日:2010-11-17

    申请号:CN200910138455.9

    申请日:2009-05-13

    IPC分类号: G06F17/30 H04N7/26 G06K9/00

    摘要: 提供一种用于生成视频信号的视频摘要的方法,包括:视频解码步骤,对视频信号进行解码,以便获得多帧视频解码图像;字幕特性获得步骤,获得所述多帧视频解码图像中包含的所有字幕中每一个字幕的如下特性中的至少一种:字幕的持续时间,字幕在相应的视频解码图像中的位置,字幕的字符尺寸,字幕图像经光学字符识别(OCR)后的识别码和可信度;视频摘要生成步骤,根据所述视频信号的内容与字幕的特性之间的关系,对所获得的字幕的至少一种特性进行处理,以便生成与所述视频信号的内容相适应的视频摘要。本发明的方法使得可生成能准确地反映原始视频文件的主要内容的视频摘要。还提供生成视频信号的视频摘要的装置及其具有该装置的图像处理系统。

    地址识别装置和方法
    34.
    发明授权

    公开(公告)号:CN100555308C

    公开(公告)日:2009-10-28

    申请号:CN200510089537.0

    申请日:2005-07-29

    IPC分类号: G06K9/00 G06K9/72

    摘要: 本发明公开的一种地址识别方法包括字符分割步骤、关键字符提取步骤、地名整体识别步骤、地址确定步骤,其中,所述关键字符提取步骤用于从多个单字符区域中提取关键字符,其中,所述关键字符提取步骤对所述多个单字符区域中的每个单字符区域进行的操作包括如下步骤:提取特征向量的步骤,提取所述单字符区域所对应的图像的特征向量;匹配步骤,将所提取的特征向量与只包括所有可能关键字符的关键字符字典中的关键字符的特征向量逐一匹配,寻找所有可能候选关键字符。

    指定文本行提取方法和装置

    公开(公告)号:CN100514355C

    公开(公告)日:2009-07-15

    申请号:CN200510098628.0

    申请日:2005-09-05

    IPC分类号: G06K9/20

    摘要: 指定文本行提取方法和装置。本发明的在垂直方向上分离文本行图像的方法,包括:多行判断步骤,判断所述文本行图像是否包含多行文本;行间噪声去除步骤,在判断出所述文本行图像包含多行文本时,进行行间噪声去除。本发明还提供了一种提取指定文本行的方法。

    图像识别装置、图像识别程序和图像识别方法

    公开(公告)号:CN101425141A

    公开(公告)日:2009-05-06

    申请号:CN200810174982.0

    申请日:2008-10-31

    IPC分类号: G06K9/20 G06K9/78

    CPC分类号: G06K9/2054 G06K2209/01

    摘要: 图像识别装置、图像识别程序和图像识别方法。一种图像识别方法,该方法针对将各字符串分别描述为构成逻辑结构的多个逻辑元素的图像,并基于以对应于该逻辑结构的方式设置的逻辑结构模型来识别各逻辑元素,该方法包括以下步骤:收集关于待利用该逻辑结构模型处理的逻辑结构的图像的信息;在以对应于新逻辑结构的方式将该逻辑结构模型更新为新逻辑结构模型时,通过以更新后的逻辑结构模型来处理收集的信息而获得在基于更新后的结构模型针对与更新前的逻辑结构模型相对应的逻辑结构的图像进行识别时的识别结果;比较在利用更新前的逻辑结构模型处理所收集的信息时的识别结果是否和根据更新后的逻辑结构模型所获取的识别结果相匹配;并且在比较的结果为不匹配的情况下,向输出单元输出表示关于更新后的逻辑结构模型的警告的警告信息。

    灰度字符词典的生成装置
    38.
    发明公开

    公开(公告)号:CN1804869A

    公开(公告)日:2006-07-19

    申请号:CN200510000439.5

    申请日:2005-01-11

    IPC分类号: G06K9/72

    摘要: 一种灰度字符词典生成装置,包括:第一级合成灰度退化字符图像生成单元,用于利用输入于其中的各二值字符图像生成第一级合成灰度退化字符图像;聚类单元,用于将所述第一级合成灰度退化字符图像生成单元生成的每一类第一级合成灰度退化字符图像分为多个聚类;模板计算单元,用于为每一个所述聚类生成模板;转换矩阵计算单元,用于针对各模板生成转换矩阵;第二级合成灰度退化字符词典生成单元,利用所述转换矩阵获取每个聚类中的每个灰度退化字符的字符特征,构建各类合成灰度退化字符的特征空间,即第二级合成灰度字符词典。

    字识别装置,字识别方法和存储介质

    公开(公告)号:CN1347060A

    公开(公告)日:2002-05-01

    申请号:CN01135340.6

    申请日:2001-09-29

    发明人: 堀田悦伸

    IPC分类号: G06K9/62 G06K9/46

    摘要: 特征字典的容量被减小,并作为特征字典被存储。通过对于字符特征,以列或行为单位,对特征矢量分组,使m个列矢量代表列或行特征,并通过分配1~m标记数字降低所述容量。通过用其他行或列特征之和,或用其他行或列特征与执行分组后的区别特征的和来代表行或列特征,或者通过对字符特征进行维数压缩可进一步减小所述字典的容量。通过基于要识别的字列表,合成用于比较的字特征,并比较从输入字中提取的特征与所述合成特征,实现字识别。或者,可以用非线形弹性匹配实现维数不同的输入字与输入字特征之间的比较。

    文本提取方法和装置
    40.
    发明授权

    公开(公告)号:CN104732188B

    公开(公告)日:2017-12-08

    申请号:CN201310705512.3

    申请日:2013-12-19

    IPC分类号: G06K9/00 G06K9/46

    摘要: 本发明涉及一种文本提取方法和装置。一种文本提取方法,包括:获取用户对图像上感兴趣的文本的指定;确定文本的大小;确定文本的排列方向;估计文本的排列方向的偏移角度;根据文本的大小、排列方向和偏移角度来确定包含文本的图像片段;对图像片段中的种子连通部件进行种子连通部件生长以提取用户感兴趣的文本。