一种从PDF中提取图片的方法、系统及装置
摘要:
本发明公开了一种PDF中图片识别和提取的方法、系统及装置。本发明通过截取PDF文件为图片:对所述图片进行一系列预处理操作,获取其轮廓图并分析去噪后在图片上标注,依据所述标注对图片进行分割提取。发明基于PDF内容提取的不方便,采用图像处理和图像过滤的相结合的方法自动识别出各种图片并切割保存,大大降低了从PDF中获取图片数据的效率。
0/0