发明公开
- 专利标题: 网页正文中图片的提取方法及装置
- 专利标题(英): Method and device for extracting pictures in webpage content
-
申请号: CN201210148409.9申请日: 2012-05-14
-
公开(公告)号: CN103425644A公开(公告)日: 2013-12-04
- 发明人: 蔡兵 , 张凯 , 徐羽
- 申请人: 腾讯科技(深圳)有限公司
- 申请人地址: 广东省深圳市福田区赛格科技园2栋东403室
- 专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人: 腾讯科技(深圳)有限公司
- 当前专利权人地址: 广东省深圳市福田区赛格科技园2栋东403室
- 代理机构: 北京三高永信知识产权代理有限责任公司
- 代理商 张耀光
- 主分类号: G06F17/30
- IPC分类号: G06F17/30
摘要:
本发明公开了一种网页正文中图片的提取方法及装置,属于计算机技术领域。所述方法包括:获取网页正文中的图片节点,并获取所述图片节点的文字描述信息;根据所述图片节点的文字描述信息在获取的图片节点中提取与所述网页正文相关程度最大的图片。本发明还公开了一种网页正文中图片的提取装置,所述装置包括:第一获取模块和第一提取模块。本发明提高了提取的图片与网页正文的相关度,从而使得所提取的图片所代表的网页信息主题更明确,极大地提升了用户的体验。
公开/授权文献
- CN103425644B 网页正文中图片的提取方法及装置 公开/授权日:2016-04-06