Invention Publication
- Patent Title: 一种数据提取方法、装置及介质
- Patent Title (English): Data extraction method and device and medium
-
Application No.: CN201910960391.4Application Date: 2019-10-10
-
Publication No.: CN110851675APublication Date: 2020-02-28
- Inventor: 王海滨 , 王存远 , 周成祖 , 林文楷 , 鄢小征 , 朱海勇
- Applicant: 厦门市美亚柏科信息股份有限公司
- Applicant Address: 福建省厦门市软件园二期观日路12号102-402单元
- Assignee: 厦门市美亚柏科信息股份有限公司
- Current Assignee: 厦门市美亚柏科信息股份有限公司
- Current Assignee Address: 福建省厦门市软件园二期观日路12号102-402单元
- Agency: 厦门福贝知识产权代理事务所
- Agent 陈远洋
- Main IPC: G06F16/906
- IPC: G06F16/906 ; G06F16/90

Abstract:
本发明提供了一种数据提取方法、装置及存储介质,基于复杂特征自适应匹配方法和可变滑动窗口方法进行数据的提取,该方法首先从多个数据源中获取海量的数据后进行聚类,并为聚类后的每一类别数据设置唯一的数据标签;然后根据所述数据标签判断该类别数据是否为已知类型的数据,如果是,则使用复杂特征自适应匹配方法对该类别数据进行特征提取,如果否,则使用可变滑动窗口方法该类别数据进行特征提取,并将结果保存在数据库中。本发明通过复杂特征自适应匹配算法精准快速地提取已知类型数据中的有价值信息,通过可变滑动窗口算法,对未知类型原始数据进行特征循环比对,减少了有价值数据的漏提比例,提升大数据分析和核心线索快速定位的能力。
Public/Granted literature
- CN110851675B 一种数据提取方法、装置及介质 Public/Granted day:2022-05-17
Information query