-
公开(公告)号:CN105701767A
公开(公告)日:2016-06-22
申请号:CN201410709262.5
申请日:2014-11-28
申请人: 富士通株式会社
摘要: 本发明涉及一种全景图像构建装置和方法。该全景图像构建装置包括:搜索模块,被配置成在网络上搜索与表示场景信息的关键字相关的图像;提取模块,被配置成提取所述图像的特征;生成模块,被配置成通过根据所述特征将所述图像进行聚类,生成图像簇;及拼接模块,被配置成将所述图像簇进行拼接,以构建全景图像。通过本发明,用于构建全景图像的相关图像的获得将不用人工完成,全景图像的构建不再依赖GPS信息,用户能够构建任意时刻的全景图像,并且全景图像的构建不再局限于地点、风景信息,而是延伸至任意动态场景。
-
公开(公告)号:CN102867178B
公开(公告)日:2015-06-10
申请号:CN201110187137.9
申请日:2011-07-05
申请人: 富士通株式会社
IPC分类号: G06K9/20
摘要: 本发明提供一种汉字识别装置和方法,该装置包括:第一识别单元用于对文本图像进行切分和识别,以获得识别信息;错误检测单元,用于利用该第一识别单元获得识别信息中图像单元的位置信息和识别编码信息检测错误切分的图像单元;错误修正单元,用于对该错误检测单元检测出的该错误切分的图像单元进行修正;第二识别单元,用于对该错误修正单元修正后的该图像单元进行识别,以获得相应的识别编码信息。通过本发明实施例,利用对文本图像进行识别后获得的识别信息中的识别编码信息和图像单元位置信息检测错误切分的图像单元并对错误切分的图像单元进行修正,从而可提高识别精度,解决现有技术中存在的问题。
-
公开(公告)号:CN101887439B
公开(公告)日:2014-04-02
申请号:CN200910138455.9
申请日:2009-05-13
申请人: 富士通株式会社
IPC分类号: H04N21/8549 , H04N21/4402 , H04N5/278 , G06K9/00
摘要: 提供一种用于生成视频信号的视频摘要的方法,包括:视频解码步骤,对视频信号进行解码,以便获得多帧视频解码图像;字幕特性获得步骤,获得所述多帧视频解码图像中包含的所有字幕中每一个字幕的如下特性中的至少一种:字幕的持续时间,字幕在相应的视频解码图像中的位置,字幕的字符尺寸,字幕图像经光学字符识别(OCR)后的识别码和可信度;视频摘要生成步骤,根据所述视频信号的内容与字幕的特性之间的关系,对所获得的字幕的至少一种特性进行处理,以便生成与所述视频信号的内容相适应的视频摘要。本发明的方法使得可生成能准确地反映原始视频文件的主要内容的视频摘要。还提供生成视频信号的视频摘要的装置及其具有该装置的图像处理系统。
-
公开(公告)号:CN103473543A
公开(公告)日:2013-12-25
申请号:CN201210187523.2
申请日:2012-06-07
申请人: 富士通株式会社
IPC分类号: G06K9/46
CPC分类号: G06T7/0085 , G06T7/12
摘要: 本发明提供了用于提取图像中对象边界的装置、方法以及电子设备,以至少克服现有的边界提取技术中存在的提取精度低或者需要多次手工调整的问题。上述装置包括:用于确定图像中对象的边界的起点和终点、以及确定与上述起点和终点相关的参考点的位置的位置确定单元;用于确定边界的第一方向的第一方向确定单元;用于获得第一区域的梯度图的梯度图获得单元;用于衰减梯度图中第二区域的梯度的梯度衰减单元;以及用于提取对象边界的提取单元。上述方法用于执行能够实现上述装置的功能的处理。上述电子设备包括上述装置。本发明的上述技术能够提高边界提取的精度,可以应用于图像处理领域。
-
公开(公告)号:CN102129546B
公开(公告)日:2013-07-10
申请号:CN201010004431.7
申请日:2010-01-15
申请人: 富士通株式会社
摘要: 提供了一种二值图像的识别方法和装置,其中,在所述二值图像中包括表格线和笔划,所述方法包括:确定表格线的垂直和水平框线的位置;对所述表格线的垂直框线进行移除处理;对移除表格线的垂直框线后的二值图像进行细化;在细化后的二值图像上跟踪所述表格线的水平框线的最短路径;判断所跟踪的路径与笔划的相交类型,基于预设的相交类型和相应的相交部分是否是笔划部分的对应关系来确定所述跟踪路径上与所述笔划相交的部分是否是笔划部分;以及保留所述跟踪路径上的笔划部分,移除所述跟踪路径上的非笔划部分。
-
公开(公告)号:CN102890783A
公开(公告)日:2013-01-23
申请号:CN201110209832.0
申请日:2011-07-20
申请人: 富士通株式会社
CPC分类号: G06K9/3208 , G06F17/275 , G06K9/344 , G06K2209/01
摘要: 本发明公开了一种识别图像块中文字的方向的方法和装置。所述方法包括:分别以不同的方向作为假设文字方向对所述图像块进行光学字符识别处理,以得到在各个所述假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;判断图像块中文字所属的语言组;调整各个所述假设文字方向上不属于所判断的语言组的识别字符所对应的子图像块对应的正确性度量;基于调整后的正确性度量计算各个所述假设文字方向上的累积正确性度量;以及根据所述累积正确性度量识别图像块中文字的方向。
-
公开(公告)号:CN102867178A
公开(公告)日:2013-01-09
申请号:CN201110187137.9
申请日:2011-07-05
申请人: 富士通株式会社
IPC分类号: G06K9/20
摘要: 本发明提供一种汉字识别装置和方法,该装置包括:第一识别单元用于对文本图像进行切分和识别,以获得识别信息;错误检测单元,用于利用该第一识别单元获得识别信息中图像单元的位置信息和识别编码信息检测错误切分的图像单元;错误修正单元,用于对该错误检测单元检测出的该错误切分的图像单元进行修正;第二识别单元,用于对该错误修正单元修正后的该图像单元进行识别,以获得相应的识别编码信息。通过本发明实施例,利用对文本图像进行识别后获得的识别信息中的识别编码信息和图像单元位置信息检测错误切分的图像单元并对错误切分的图像单元进行修正,从而可提高识别精度,解决现有技术中存在的问题。
-
公开(公告)号:CN101546424B
公开(公告)日:2012-07-25
申请号:CN200810087720.0
申请日:2008-03-24
申请人: 富士通株式会社
摘要: 本发明提供了一种图像处理方法及装置,用于从三幅或三幅以上的多幅图像中找出共有图案。该方法包括:对N幅图像进行图像特征提取,根据特征提取的结果将N幅图像分为C层,使得共有图案的图像基本上聚集在C层中的某一层中,其中C为自然数且大于等于2;计算每一层的N幅图像的平均相似度;以及将平均相似度最大的那一层的合成图像确定为包含共有图案的图像,其中,合成图像是以该层的基准图像为基础,将N幅图像进行合成而得到的,而基准图像是该层的N幅图像中的一幅与其余N-1幅图像的匹配优选的图像。本发明还提供了一种包含上述图像处理装置的水印检测系统。本发明可以应用于从多幅文档图像中检测水印。
-
公开(公告)号:CN102375978A
公开(公告)日:2012-03-14
申请号:CN201010257664.8
申请日:2010-08-17
申请人: 富士通株式会社
CPC分类号: G06K9/00449
摘要: 公开了一种处理图像的方法和设备。从多个图像的每个中提取格线且将所提取的格线拟合到实数二维空间中。通过将每个图像中所提取的格线与格线模板对齐来确定所拟合的格线围成的拟合单元格与格线模板的模板单元格间的对应关系。针对相对应的每对单元格,根据其间的仿射变换将模板单元格中每个像素的位置映射到实数二维空间中的实数位置。根据图像中具有与实数位置相邻的位置的多个像素的像素值生成一个像素值,以作为与实数位置对应的模板单元格中的像素的像素值。通过合并格线模板的格线和具有所生成的像素值的模板单元格中像素,生成对应于图像的合成图像。根据多个图像的相应合成图像获得表格模板。
-
-
-
-
-
-
-
-
-