一种物联网动态页面实时信息采集方法
摘要:
一种物联网动态页面实时信息采集方法,所述方法分为四个部分,涉及四个模块,这四个模块分别是加载页面模块、获取页面HTML模块、解析所得HTML模块和数据存储模块,加载页面模块通过网络链接地址加载外部页面,并将加载的动态页面传递给获取HTML模块,由获取HTML模块获取该页面的HTML文档,同时将所获得的HTML文档传递给解析HTML模块,解析HTML模块通过定位技术从得到的HTML文档中解析出所需要的文本内容,并将这些文本内容传给数据存储模块进行存储。本发明实现了物联网实体动态信息的实时获取及存储,而且不需要连接服务器上的数据库,具有良好的可扩展性,能满足物联网海量数据量的处理要求。
公开/授权文献
0/0