-
公开(公告)号:CN113326253A
公开(公告)日:2021-08-31
申请号:CN202010130614.7
申请日:2020-02-28
申请人: 拓尔思天行网安信息技术有限责任公司
IPC分类号: G06F16/215
摘要: 本申请公开了一种基于全文数据库的数据清洗方法、装置、设备和存储介质,该方法包括根据预设规则从多个不同业务系统中抽取源数据;根据预先设置的编码表和字段名命名规则,分别翻译源数据,并修改源数据中的字段名;对经过翻译和修改字段名之后的源数据进行分级标引,生成成品数据并保存至全文数据库。本申请实施例能够将不同业务系统中的数据统一抽取、加工,并生成成品数据保存至全文数据库,同时将相关数据加工处理到同一条记录中,保证了数据的完整性,弥补了全文数据库不能关联查询的缺陷。