-
公开(公告)号:CN117745595B
公开(公告)日:2024-06-25
申请号:CN202410180642.8
申请日:2024-02-18
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06T5/77 , G06N3/0455 , G06N3/08 , G06T3/4046 , G06T3/4053 , G06T5/50 , G06V10/42 , G06V10/82 , G06T5/60
摘要: 本申请涉及一种图像处理方法、装置、电子设备及存储介质,所述方法包括:获取携带有杂质的原始图像,并确定所述原始图像对应的原始特征图;根据所述原始特征图,生成所述原始图像对应的多个不同尺度的目标特征图;根据多个不同尺度的所述目标特征图,生成无杂质的目标图像。如此通过原始图像对应的多个不同尺度的目标特征图,可以生成无杂质的目标图像,其杂质去除的非常干净,不会存在杂质残留,并且能很好的保持原有图像彩色,还原干净、清晰的图像,杂质区域与非杂质区域不会存在色差。
-
公开(公告)号:CN117636361A
公开(公告)日:2024-03-01
申请号:CN202210977757.0
申请日:2022-08-15
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06V30/19 , G06V30/18 , G06V10/40 , G06V10/762 , G06V10/764 , G06V10/82
摘要: 本发明实施例涉及一种文字属性识别方法、装置及存储介质,包括:从目标文档中提取出多个文本条图片,其中,每个所述文本条图片包含所述目标文档中的至少一个文本条,所述文本条为行文本,或,列文本;对多个所述文本条图片进行分类,得到至少一个图片类别,其中,同一所述图片类别中的文本条图片所包含文字的属性相同;针对每个所述图片类别,基于所述图片类别中至少一个所述文本条图片确定所述图片类别中所有文本条图片所包含文字的属性。由此,可以实现从文本条的层面先对文字属性进行分类,再针对每一类文字属性进行识别,从而提高识别的准确性。
-
公开(公告)号:CN117291152A
公开(公告)日:2023-12-26
申请号:CN202210692042.0
申请日:2022-06-17
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06F40/154 , G06F40/174 , G06F40/18
摘要: 本发明公开了一种表格的提取方法和装置。该方法包括:识别图像中的待提取的原始表格,提取原始表格的单元格结构,其中,原始表格中的内容不可编辑;提取原始表格中的文本属性;将单元格结构和文本属性转换为超文本标记语言描述;解析超文本标记语言描述,得到目标表格,其中,目标表格中的内容可编辑。本发明解决了无法将图像中的表格数据转换为可编辑的表格数据的技术问题。
-
公开(公告)号:CN117151106A
公开(公告)日:2023-12-01
申请号:CN202210565809.3
申请日:2022-05-19
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06F40/30 , G06F40/166 , G06N3/042 , G06N3/0464 , G06N3/08
摘要: 本发明实施例涉及一种文档大纲生成方法、装置、电子设备及存储介质,所述方法包括:从待识别文档中提取大纲条目集合;提取所述大纲条目集合中每个大纲条目的特征信息;基于每个所述大纲条目的特征信息,确定每个所述大纲条目的大纲级别以及大纲条目间的从属关系;基于每个所述大纲条目的大纲级别以及所述大纲条目间的从属关系,生成所述待识别文档的大纲。由此,可以实现智能地生成文档大纲。
-
公开(公告)号:CN117668336A
公开(公告)日:2024-03-08
申请号:CN202211042633.X
申请日:2022-08-29
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06F16/93 , G06F16/906 , G06F16/16 , G06V30/19 , G06V30/148 , G06V10/82
摘要: 本发明提供一种文档处理方法及装置,其中,该方法包括:拍摄目标文档,获取第一图片;基于第一图片,生成目标格式的第一文件,并基于第一图片,对第一文件进行分类,确定第一文件的第一类型;提取第一图片中的文字信息,并基于文字信息,确定第一文件的第二类型;第二类型是第一类型的子类型。本发明提供的文档处理方法及装置,通过拍摄目标文档,获取第一图片,基于第一图片进行粗分类,自动确定第一文件的第一类型,然后基于第一图片中的文字信息进行细分类,自动确定第一文件的第二类型,能更快速、高效地确定第一文件的第一类型和第二类型,能基于第一文件的第一类型和第二类型,对第一文件进行更高效的归类,能提高纸质文档归类的效率。
-
公开(公告)号:CN117475444A
公开(公告)日:2024-01-30
申请号:CN202210837800.3
申请日:2022-07-15
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06V30/19 , G06V30/148 , G06V30/14 , G06V10/82 , G06N3/08 , G06V30/146
摘要: 本发明提供一种文本图像识别模型训练方法、文本图像识别方法和设备,涉及图像处理技术领域。该方法包括:在训练文本图像识别模型时,可以先获取多个竖排文本图像样本,以及各竖排文本图像样本对应的文本内容和文本朝向;将对多个竖排文本图像样本旋转得到的横向排布的多个目标竖排文本图像样本输入至初始文本图像识别模型中,得到各竖排文本图像样本对应的预测文本内容和预测文本朝向;根据各竖排文本图像样本对应的文本内容、文本朝向、预测文本内容以及预测文本朝向,对初始文本图像识别模型的模型参数进行更新,这样训练得到的文本图像识别模型可以准确地识别任意文本朝向的竖排文本图像,从而提高了识别结果的准确度。
-
公开(公告)号:CN117152762A
公开(公告)日:2023-12-01
申请号:CN202210573457.6
申请日:2022-05-24
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06V30/148 , G06V30/164 , G06F16/51 , G06F16/538 , G06V10/26 , G06V10/30 , G06V10/74
摘要: 本申请提供了一种字体库生成的方法、装置、文字的编辑方法、装置和介质。该方法包括:获取待处理的图像,其中,图像中包括至少一种字体的文字;识别图像中文字的字体,并从图像中提取属于目标字体的文字所在的目标图像块;基于目标图像块进行训练,得到目标字体库,其中,目标字体库中包括属于目标字体的至少一个文字。该方案中,对于目标字体,通过对其所在的目标图像块进行训练,可以创建目标字体的目标字体库,在编辑图像中的文字时,目标字体通过目标字体库可以保持原有的字体,从而保证了字体统一,进而解决了现有技术中编辑图像中的文字时,无法将字体统一的问题。
-
公开(公告)号:CN117745595A
公开(公告)日:2024-03-22
申请号:CN202410180642.8
申请日:2024-02-18
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06T5/77 , G06N3/0455 , G06N3/08 , G06T3/4046 , G06T3/4053 , G06T5/50 , G06V10/42 , G06V10/82 , G06T5/60
摘要: 本申请涉及一种图像处理方法、装置、电子设备及存储介质,所述方法包括:获取携带有杂质的原始图像,并确定所述原始图像对应的原始特征图;根据所述原始特征图,生成所述原始图像对应的多个不同尺度的目标特征图;根据多个不同尺度的所述目标特征图,生成无杂质的目标图像。如此通过原始图像对应的多个不同尺度的目标特征图,可以生成无杂质的目标图像,其杂质去除的非常干净,不会存在杂质残留,并且能很好的保持原有图像彩色,还原干净、清晰的图像,杂质区域与非杂质区域不会存在色差。
-
公开(公告)号:CN115471844A
公开(公告)日:2022-12-13
申请号:CN202211000541.5
申请日:2022-08-19
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06V30/148 , G06V30/14 , G06V30/16 , G06V30/162 , G06V30/19 , G06V10/82 , G06N3/08
摘要: 本申请涉及图像识别技术领域,公开一种图像处理方法,包括:对图像进行预设文字属性标记处理,获得第一文字区域;获取所述第一文字区域中的文字具有所述预设文字属性的可信度;根据所述可信度从所述第一文字区域中确定出第二文字区域,所述第二文字区域中的文字具有预设文字属性。由于第二文字区域是根据第一文字区域中的文字具有预设文字属性的可信度来确定的,使得第二文字区域中的文字具有预设文字属性的准确性更高,从而提高了识别图像中文字属性的准确性。本申请还公开一种图像处理装置及电子设备、存储介质。
-
公开(公告)号:CN115379061A
公开(公告)日:2022-11-22
申请号:CN202210959346.9
申请日:2022-08-10
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
摘要: 本发明实施例涉及一种拍照扫描方法及装置,方法包括:获取拍照扫描设备在拍照预览模式下针对被扫描对象采集的预览图像;从所述预览图像中识别出所述被扫描对象的类型;根据所述被扫描对象的类型确定目标拍照扫描模式;将拍照扫描设备的拍照扫描模式设置为所述目标拍照扫描模式,并按照所述目标拍照扫描模式对所述被扫描对象进行拍照扫描。由此,可以简化用户操作过程,提升用户体验。
-
-
-
-
-
-
-
-
-