受限Web数据库的数据抽取方法及装置
摘要:
本发明涉及计算机技术领域,提供了一种受限Web数据库的数据抽取方法及装置。方法包括:抽取装置获得Web数据库查询接口中的一个属性值;生成查询请求,发送给受限Web数据库;解析查询反馈的网页页面,抽取出查询数据;根据查询数据更新本地数据库中的数据;通过基于EdaliwdbFCA算法对本地数据库进行分析,产生下一组查询属性值;当查询数据的条数等于预设阈值时,结束数据的抽取。抽取装置包括查询属性值获得单元、查询单元、解析单元、数据更新单元、查询属性值生成单元和查询结束单元。通过结合形式概念分析方法对基于属性值查询接口的受限Web数据库的数据抽取,实现在受限Web数据库中抽取出质量较高的数据,并且具有稳定性好、效率快的特点。
公开/授权文献
0/0