Web主题信息提取方法及系统
摘要:
本发明公开一种Web主题信息提取方法及系统。其中在Web主题信息提取方法中,通过根据指定Web页面的编码格式获得Web页面的分页链接格式,根据分页链接格式获得指定分页中的全部内容链接信息,其中内容链接信息包括内容链接地址;对于每个内容链接信息,获取内容链接地址指向的链接页面的Html源代码,分析链接页面的编码格式;根据链接页面的编码格式,提取链接页面的Web主题信息,并生成页面快照。由于可获得指定分页中全部内容链接信息相关联的Web主题信息,从而便于用户对Web信息的灵活定制,并有效避免访问时间的耗费和通信流量的损失。
公开/授权文献
0/0