发明授权
CN104699848B 受限Web数据库的数据抽取方法及装置
失效 - 权利终止
- 专利标题: 受限Web数据库的数据抽取方法及装置
-
申请号: CN201510154092.3申请日: 2015-04-02
-
公开(公告)号: CN104699848B公开(公告)日: 2018-04-27
- 发明人: 杜鹃 , 张卓
- 申请人: 黄河水利职业技术学院 , 郑州大学
- 申请人地址: 河南省开封市龙亭区西门大街115号
- 专利权人: 黄河水利职业技术学院,郑州大学
- 当前专利权人: 黄河水利职业技术学院,郑州大学
- 当前专利权人地址: 河南省开封市龙亭区西门大街115号
- 代理机构: 北京超凡志成知识产权代理事务所
- 代理商 饶钱
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明涉及计算机技术领域,提供了一种受限Web数据库的数据抽取方法及装置。方法包括:抽取装置获得Web数据库查询接口中的一个属性值;生成查询请求,发送给受限Web数据库;解析查询反馈的网页页面,抽取出查询数据;根据查询数据更新本地数据库中的数据;通过基于EdaliwdbFCA算法对本地数据库进行分析,产生下一组查询属性值;当查询数据的条数等于预设阈值时,结束数据的抽取。抽取装置包括查询属性值获得单元、查询单元、解析单元、数据更新单元、查询属性值生成单元和查询结束单元。通过结合形式概念分析方法对基于属性值查询接口的受限Web数据库的数据抽取,实现在受限Web数据库中抽取出质量较高的数据,并且具有稳定性好、效率快的特点。
公开/授权文献
- CN104699848A 受限Web数据库的数据抽取方法及装置 公开/授权日:2015-06-10