-
公开(公告)号:CN105450453A
公开(公告)日:2016-03-30
申请号:CN201510880806.9
申请日:2015-12-03
申请人: 贵州电网公司信息通信分公司 , 电子科技大学
发明人: 杨耀 , 刘旭航 , 申洲 , 李由 , 熊铖 , 陈利民 , 陆飙 , 任阳阳 , 张菡 , 刘毅 , 王玮 , 撒兴杰 , 郑元伟 , 李伯森 , 黎皓 , 张祥忠 , 刘晓波 , 于富财
IPC分类号: H04L12/24
CPC分类号: H04L41/0213 , H04L41/12
摘要: 本发明公开了一种基于SNMP协议的网络拓扑构建方法。该构建方法包括拓扑信息采集、信息提取、信息过滤和拓扑构建。本发明具有,构建效率高、网络负载低和拓扑布局合理的特点。
-
公开(公告)号:CN106339455B
公开(公告)日:2019-06-04
申请号:CN201610729817.1
申请日:2016-08-26
申请人: 电子科技大学
IPC分类号: G06F16/957
摘要: 本发明公开了一种基于文本标签特征挖掘的网页正文提取方法,包括以下步骤:S1、进行网页标签预处理及Html标签修复;S2、Html标签特征选择及提取;S3、标签特征聚类挖掘及正文簇选择;S4、正文簇内标签经验性调整;S5、正文簇标签文本提取。本发明通过对网页源码进行标签挖掘,运用层次聚类算法对网页标签进行聚类,提取出正文标签所在的簇,再根据经验对标签簇内的标签进行调整,再根据调整后的正文簇特征进行文本提取。本方法相对于其他新闻网页文本抽取方法而言,具有更好的通用性、高准确率、易用性,不用针对特定网页做任何特殊设定。
-
-
公开(公告)号:CN106339455A
公开(公告)日:2017-01-18
申请号:CN201610729817.1
申请日:2016-08-26
申请人: 电子科技大学
IPC分类号: G06F17/30
CPC分类号: G06F16/9577
摘要: 本发明公开了一种基于文本标签特征挖掘的网页正文提取方法,包括以下步骤:S1、进行网页标签预处理及Html标签修复;S2、Html标签特征选择及提取;S3、标签特征聚类挖掘及正文簇选择;S4、正文簇内标签经验性调整;S5、正文簇标签文本提取。本发明通过对网页源码进行标签挖掘,运用层次聚类算法对网页标签进行聚类,提取出正文标签所在的簇,再根据经验对标签簇内的标签进行调整,再根据调整后的正文簇特征进行文本提取。本方法相对于其他新闻网页文本抽取方法而言,具有更好的通用性、高准确率、易用性,不用针对特定网页做任何特殊设定。
-
-
-