-
公开(公告)号:CN108140144B
公开(公告)日:2021-06-01
申请号:CN201680061886.8
申请日:2016-03-31
申请人: 富士通株式会社
IPC分类号: G06N3/08
摘要: 一种对神经网络模型进行训练的方法、装置和电子设备。该方法包括:提取神经网络模型的一部分,以形成神经网络子模型;对所述神经网络子模型进行训练,以形成优化的神经网络子模型;根据所述优化的神经网络子模型中的各权值,初始化所述神经网络模型中的各权值,以形成初始化神经网络模型,并且,所述初始化神经网络模型与所述优化的神经网络子模型具有相同的输出特性;基于已知训练集,对所述初始化神经网络模型中的各权值进行调整。根据该方法,能够缩短大规模神经网络的训练时间并避免过拟合问题。
-
公开(公告)号:CN106339704A
公开(公告)日:2017-01-18
申请号:CN201510413366.6
申请日:2015-07-14
申请人: 富士通株式会社
IPC分类号: G06K9/20
CPC分类号: G06K9/2009
摘要: 公开了一种字符识别方法和字符识别设备。该字符识别方法包括:字符栏提取步骤,用于提取包括若干行字符串的字符栏;字符占位宽度和字符空白间隔确定步骤,用于对字符栏中的预定行字符串进行字符切分,通过投票确定字符占位宽度和字符空白间隔;字符切分模板生成步骤,用于基于字符占位宽度和字符空白间隔生成字符切分模板;字符串切分步骤,用于使用字符切分模板对字符栏中的除预定行字符串之外的字符串或全部字符串进行切分;以及字符识别步骤,用于对通过切分得到的字符进行识别。根据本公开的实施例,能够提高字符识别的速度和准确率。
-
公开(公告)号:CN103473543B
公开(公告)日:2016-10-05
申请号:CN201210187523.2
申请日:2012-06-07
申请人: 富士通株式会社
IPC分类号: G06K9/46
CPC分类号: G06T7/0085 , G06T7/12
摘要: 本发明提供了用于提取图像中对象边界的装置、方法以及电子设备,以至少克服现有的边界提取技术中存在的提取精度低或者需要多次手工调整的问题。上述装置包括:用于确定图像中对象的边界的起点和终点、以及确定与上述起点和终点相关的参考点的位置的位置确定单元;用于确定边界的第一方向的第一方向确定单元;用于获得第一区域的梯度图的梯度图获得单元;用于衰减梯度图中第二区域的梯度的梯度衰减单元;以及用于提取对象边界的提取单元。上述方法用于执行能够实现上述装置的功能的处理。上述电子设备包括上述装置。本发明的上述技术能够提高边界提取的精度,可以应用于图像处理领域。
-
公开(公告)号:CN103366165B
公开(公告)日:2016-06-29
申请号:CN201210091193.7
申请日:2012-03-30
申请人: 富士通株式会社
CPC分类号: G06T7/0085 , G06K9/3208 , G06K9/3233 , G06T7/12 , G06T7/136 , G06T2207/20164 , H04N1/00681
摘要: 本发明提供了图像处理装置、图像处理方法以及设备,以至少提高在针对文档所捕获的图像所进行的图像处理中的文档角点提取精度。图像处理装置包括:用于提取文档的沿第一方向的边界线和粗测文档角点的提取单元,其中,第一方向是文档图像的水平方向或垂直方向;用于在粗测文档角点附近、在沿第一方向的边界线上确定候选页角点的确定单元;以及用于在候选页角点中确定文档的文档角点的选择单元。图像处理方法用于执行能够实现上述图像处理装置的功能的处理。上述设备包括上述图像处理装置。应用本发明的上述技术,能够提取到较精确的文档角点,获得较好的图像处理效果,可以应用于图像处理领域。
-
公开(公告)号:CN103377462B
公开(公告)日:2016-05-04
申请号:CN201210111235.9
申请日:2012-04-16
申请人: 富士通株式会社
IPC分类号: G06T5/00
CPC分类号: G06T5/001 , G06T5/005 , G06T2207/10008 , G06T2207/30176
摘要: 本发明涉及对扫描图像进行处理的方法和装置。对扫描图像进行处理的方法包括:被遮挡区域提取步骤,提取扫描图像的边缘附近的空白处被遮挡物遮挡的区域,即被遮挡区域;像素值修复步骤,根据贯穿被遮挡区域且与边缘平行的线段中的已知页边空白像素的像素值,通过线性模型来修复线段中的被遮挡区域像素的像素值;根据贯穿所述被遮挡区域且与边缘平行的线段中的已知页边空白像素的噪声来估计线段中的被遮挡区域像素的噪声;以及将估计出的噪声添加到通过线性模型修复的线段中的被遮挡区域像素的像素值。
-
公开(公告)号:CN102890783B
公开(公告)日:2015-07-29
申请号:CN201110209832.0
申请日:2011-07-20
申请人: 富士通株式会社
CPC分类号: G06K9/3208 , G06F17/275 , G06K9/344 , G06K2209/01
摘要: 本发明公开了一种识别图像块中文字的方向的方法和装置。所述方法包括:分别以不同的方向作为假设文字方向对所述图像块进行光学字符识别处理,以得到在各个所述假设文字方向上的子图像块、子图像块对应的识别字符及其正确性度量;判断图像块中文字所属的语言组;调整各个所述假设文字方向上不属于所判断的语言组的识别字符所对应的子图像块对应的正确性度量;基于调整后的正确性度量计算各个所述假设文字方向上的累积正确性度量;以及根据所述累积正确性度量识别图像块中文字的方向。
-
公开(公告)号:CN102890780B
公开(公告)日:2015-07-22
申请号:CN201110209866.X
申请日:2011-07-19
申请人: 富士通株式会社
CPC分类号: H04N1/40062 , G06K9/342 , G06K2209/01
摘要: 图像处理装置和方法。图像处理装置包括:局部均值图生成部分,其生成局部均值图;二值化图生成部分,其生成二值化图,其中与高频区域对应的像素具有第一灰度,与低频区域对应的像素具有第二灰度;三值化图生成部分,其根据图像与局部均值图的比较,将二值化图中第一灰度区域划分为第一灰度区域和第三灰度区域以生成三值化图;填充部分,其识别三值化图中第二灰度连通区域,并在连通区域边界处第一灰度像素与第三灰度像素数量比大于预定阈值时以第一灰度填充连通区域,而在连通区域边界处第三灰度像素与第一灰度像素数量比大于预定阈值时以第三灰度填充该连通区域;以及识别部分,其根据对象边界灰度一致性识别图像中的笔画和/或线条。
-
公开(公告)号:CN102833460B
公开(公告)日:2015-03-11
申请号:CN201110159927.6
申请日:2011-06-15
申请人: 富士通株式会社
CPC分类号: H04N1/387 , G06K9/3275 , G06K2009/363 , G06T3/0031
摘要: 提供一种图像处理方法、图像处理设备和扫描仪。该图像处理方法主要包括:求拍摄装置获得的二维图像中的弯曲表面的消失点,通过该消失点求弯曲表面上下轮廓线之间的所有直线段;去除透视变形,使得相交直线段变成平行直线段;求得上述直线段的长度,通过该长度求得每个直线段在三维空间中的实际宽度,以及所述直线段的深度增量;通过所述实际宽度和所述深度增量得到每个直线段的扩展宽度;将所有所述直线段的扩展宽度相加,求得所述弯曲表面的整体扩展宽度,以便将所述弯曲表面转换为平坦表面;通过弯曲表面和所述平坦表面上的点之间的对应关系将所述弯曲表面上的图像内容转换到所述平坦表面上。该方法可用来矫正带有畸变的书页图像。
-
公开(公告)号:CN101819625B
公开(公告)日:2014-11-12
申请号:CN200910004694.5
申请日:2009-02-27
申请人: 富士通株式会社
IPC分类号: G06K9/00
摘要: 本发明公开了一种识别设备和识别方法。该识别设备包括第一识别装置,被配置为对第一图像进行识别,以得到第一图像识别结果;第二识别结果预选装置,被配置为根据第一图像识别结果确定候选第二图像识别结果;和第二识别装置,被配置为基于候选第二图像识别结果对第二图像进行识别,以得到第二图像识别结果,其中,第一图像与第二图像具有对应关系。可选地,第二图像是字符图像,第一图像是该字符图像对应的注音图像。本发明可以提高识别的准确度。
-
-
-
-
-
-
-
-
-