数据采集方法、装置、设备及计算机可读存储介质
摘要:
本申请实施例提供一种数据采集方法、装置、设备及计算机可读存储介质。该方法包括:获取包含文本数据的图像;识别所述图像中的文本数据,得到原始文本数据集合,所述原始文本数据集合包括多条原始文本数据;基于预设杂质数据集合,滤除所述原始文本数据集合中的杂质数据,得到中间文本数据集合,所述中间文本数据集合包括多条中间文本数据;基于预设规则集合,提取所述中间文本数据集合中每条中间文本数据中的参数名和与所述参数名对应的参数值,得到目标文本数据集合;将所述目标文本数据集合输出。本申请实施例能够提高数据采集效率。
0/0