发明公开
- 专利标题: 一种从PDF中提取图片的方法、系统及装置
-
申请号: CN201910223290.9申请日: 2019-03-22
-
公开(公告)号: CN111724387A公开(公告)日: 2020-09-29
- 发明人: 周睿 , 魏永强 , 周庆国 , 仝倩倩 , 张文强 , 魏文浩 , 于亮 , 陆笛 , 廖伟志 , 胡轶凛 , 冉竹君
- 申请人: 兰州大学
- 申请人地址: 甘肃省兰州市城关区天水南路222号兰州大学
- 专利权人: 兰州大学
- 当前专利权人: 兰州大学
- 当前专利权人地址: 甘肃省兰州市城关区天水南路222号兰州大学
- 主分类号: G06T7/11
- IPC分类号: G06T7/11 ; G06T5/00 ; G06T5/30 ; G06T7/13
摘要:
本发明公开了一种PDF中图片识别和提取的方法、系统及装置。本发明通过截取PDF文件为图片:对所述图片进行一系列预处理操作,获取其轮廓图并分析去噪后在图片上标注,依据所述标注对图片进行分割提取。发明基于PDF内容提取的不方便,采用图像处理和图像过滤的相结合的方法自动识别出各种图片并切割保存,大大降低了从PDF中获取图片数据的效率。