-
公开(公告)号:CN117636361A
公开(公告)日:2024-03-01
申请号:CN202210977757.0
申请日:2022-08-15
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06V30/19 , G06V30/18 , G06V10/40 , G06V10/762 , G06V10/764 , G06V10/82
摘要: 本发明实施例涉及一种文字属性识别方法、装置及存储介质,包括:从目标文档中提取出多个文本条图片,其中,每个所述文本条图片包含所述目标文档中的至少一个文本条,所述文本条为行文本,或,列文本;对多个所述文本条图片进行分类,得到至少一个图片类别,其中,同一所述图片类别中的文本条图片所包含文字的属性相同;针对每个所述图片类别,基于所述图片类别中至少一个所述文本条图片确定所述图片类别中所有文本条图片所包含文字的属性。由此,可以实现从文本条的层面先对文字属性进行分类,再针对每一类文字属性进行识别,从而提高识别的准确性。
-
公开(公告)号:CN117523540A
公开(公告)日:2024-02-06
申请号:CN202210907094.5
申请日:2022-07-29
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06V20/62 , G06V10/28 , G06V10/44 , G06V10/774 , G06V10/80
摘要: 本发明涉及一种文本检测方法及装置,其中,所述文本检测方法包括:获取包含文本的目标图像;根据所述目标图像及预先训练的解码网络,获得文本中心区域对应的第一概率图和文本边缘区域对应的第二概率图;融合所述第一概率图和所述第二概率图,得到目标文本区域二值图;在所述目标文本区域二值图中检测文本,得到文本检测框。本申请实施例实现利用训练完毕的解码网络获得文本中心区域对应的第一概率图和文本边缘区域对应的第二概率图,并在基于二者确定的目标文本区域二值图中检测文本检测框,通过利用第二概率图中的文本边缘区域抑制第一概率图中文本中心区域,实现密集文本的检测。
-
公开(公告)号:CN117523219A
公开(公告)日:2024-02-06
申请号:CN202210900443.0
申请日:2022-07-28
申请人: 北京金山办公软件股份有限公司 , 珠海金山办公软件有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06V10/44 , G06V10/25 , G06V10/82 , G06T5/50 , G06T3/4038 , G06N3/0464
摘要: 本申请涉及计算机技术领域,公开一种图像处理方法,包括:获取待检测的图像;对所述图像按照预设的特征提取路径进行逐层的特征提取,获得多个第一特征图;对至少一个第一特征图进行坐标注意力机制处理,获得第二特征图;根据所述第一特征图和所述第二特征图确定所述图像中的线条对象。该方法能够更准确的检测图像的线条。本申请还公开一种图像处理装置、电子设备及存储介质。
-
公开(公告)号:CN111695327B
公开(公告)日:2024-01-26
申请号:CN201910150738.9
申请日:2019-02-28
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 广州金山移动科技有限公司
发明人: 冷志峰
IPC分类号: G06F40/151
摘要: 本发明实施例提供了一种乱码修复方法、装置、电子设备及可读存储介质。该方法包括:当接收到针对PDF文档中的文字的复制指令时,获得待复制的文字的charcode;查找电子设备中存储有目标位图文件的第二字库;目标位图文件为:PDF文档的内嵌字库中记录的charcode所对应的位图文件;从第二字库中读取目标位图文件所对应存储的统一码Unicode,并将Unicode复制到剪切板。这样,在对PDF文档中的文字进行复制时,可以获得待复制的文字的Unicode,并可以将待复制的文字的Unicode复制到剪切板。这样,可以保证待复制的文字能够顺利被复制,避免了乱码的情况发生。
-
公开(公告)号:CN111198664B
公开(公告)日:2024-01-26
申请号:CN201811368872.8
申请日:2018-11-16
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 广州金山移动科技有限公司
发明人: 邓斌
IPC分类号: G06F3/12
摘要: 一种文档打印的方法、装置、计算机存储介质及终端,包括:接收到打印指令时,确定当前文档需要转换到的排版格式;根据确定的排版格式,对当前文档进行排版并打印。本发明实施例简化了打印的电子文档的格式调整,提升了文档整理的效率。
-
公开(公告)号:CN117291152A
公开(公告)日:2023-12-26
申请号:CN202210692042.0
申请日:2022-06-17
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06F40/154 , G06F40/174 , G06F40/18
摘要: 本发明公开了一种表格的提取方法和装置。该方法包括:识别图像中的待提取的原始表格,提取原始表格的单元格结构,其中,原始表格中的内容不可编辑;提取原始表格中的文本属性;将单元格结构和文本属性转换为超文本标记语言描述;解析超文本标记语言描述,得到目标表格,其中,目标表格中的内容可编辑。本发明解决了无法将图像中的表格数据转换为可编辑的表格数据的技术问题。
-
公开(公告)号:CN112632929B
公开(公告)日:2023-12-26
申请号:CN201910895041.4
申请日:2019-09-20
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司
IPC分类号: G06F40/18 , G06F16/9035 , G06F18/214
摘要: 本发明实施例提供了一种基于表格数据智能推荐图表的方法、装置和电子设备。该方法包括:确定待创建图表的表格数据;按照预定的列确定方式,从所述表格数据的各列中,确定适用于图表创建的各个系列值列和各个类别列;针对每一所述类别列,基于该类别列的特征数据和目标列的特征数据,确定以该类别列和各个所述系列值列创建图表时对应的各个图表类型的推荐结果;基于所确定的推荐结果,输出所述表格数据对应的图表推荐信息。通过本方案可以达到减少用户反复的修改操作,从而提升图表创建效率的目的。
-
公开(公告)号:CN110807303B
公开(公告)日:2023-12-22
申请号:CN201810871718.6
申请日:2018-08-02
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 广州金山移动科技有限公司
发明人: 邓斌
IPC分类号: G06F40/169
摘要: 一种文档编辑的方法、装置、计算机存储介质及终端,包括:当文档中的下划线为非标准协议下划线时,确定下划线的位置;在确定的下划线的位置上,添加用于信息编辑的编辑框。本发明实施例为非标准协议下划线的编辑提供了基础,提升了文档编辑效率和用户文档编辑体验。
-
公开(公告)号:CN117252767A
公开(公告)日:2023-12-19
申请号:CN202210653831.3
申请日:2022-06-09
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
发明人: 林文松
摘要: 本发明提供一种文本图片矫正方法及装置,其中,文本图片矫正方法包括:从原始文本图片中提取至少一个文本行轮廓,从文本行轮廓中确定主轮廓;在主轮廓为弯曲轮廓的情况下,确定主轮廓的N+1组第一基准点;基于N+1组第一基准点,确定矫正文本图片的N+1组第二基准点;基于N+1组第一基准点和N+1组第二基准点,对主轮廓对应的文本行图片进行矫正,得到矫正文本图片。在主轮廓为弯曲轮廓的情况下,利用主轮廓的N+1组第一基准点和矫正文本图片的N+1组第二基准点,能够对主轮廓对应的文本行图片进行矫正,从而提高弯曲文本识别的准确率。
-
公开(公告)号:CN117151106A
公开(公告)日:2023-12-01
申请号:CN202210565809.3
申请日:2022-05-19
申请人: 珠海金山办公软件有限公司 , 北京金山办公软件股份有限公司 , 武汉金山办公软件有限公司
IPC分类号: G06F40/30 , G06F40/166 , G06N3/042 , G06N3/0464 , G06N3/08
摘要: 本发明实施例涉及一种文档大纲生成方法、装置、电子设备及存储介质,所述方法包括:从待识别文档中提取大纲条目集合;提取所述大纲条目集合中每个大纲条目的特征信息;基于每个所述大纲条目的特征信息,确定每个所述大纲条目的大纲级别以及大纲条目间的从属关系;基于每个所述大纲条目的大纲级别以及所述大纲条目间的从属关系,生成所述待识别文档的大纲。由此,可以实现智能地生成文档大纲。
-
-
-
-
-
-
-
-
-