-
公开(公告)号:CN102955810B
公开(公告)日:2015-12-02
申请号:CN201110249270.2
申请日:2011-08-26
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种网页分类方法和设备,该方法利用现有URL类别库中的记录,建立虚拟的层级URL,并对层级URL的类别进行预测。当需要对待分类网页进行分类时,根据待分类网页的URL查询URL类别库;如果未查询到匹配的URL,则根据该URL的上层URL查询URL类别库,并在查询到匹配的URL时,根据查询到的URL的预测类别确定待分类网页的类别。在本发明中,提高了网页分类的效率和成功率。
-
公开(公告)号:CN103186612A
公开(公告)日:2013-07-03
申请号:CN201110456676.8
申请日:2011-12-30
Applicant: 中国移动通信集团公司
Abstract: 本发明公开了一种词汇分类的方法、系统和实现方法,首先获取文档分类训练集,包括文档及其所属的文档类别信息,对所有文档进行预处理,形成待分类词汇,获取每个待分类词汇在一个文档类别中的TF值和IDF值,并对两者求和得到TF-IDF,除以每个待分类词汇在其文档所属的所有文档类别中的TF-IDF之和,获得的商值作为待分类词汇属于文档类别的概率,生成包括待分类词汇、待分类词汇对应的类别和待分类词汇属于对应类别的概率的词汇分类数据库。采用了本发明的技术方案,能够自动完成词汇分类,而且投入很少,效果更加准确。
-
公开(公告)号:CN103186612B
公开(公告)日:2016-04-27
申请号:CN201110456676.8
申请日:2011-12-30
Applicant: 中国移动通信集团公司
Abstract: 本发明公开了一种词汇分类的方法、系统和实现方法,首先获取文档分类训练集,包括文档及其所属的文档类别信息,对所有文档进行预处理,形成待分类词汇,获取每个待分类词汇在一个文档类别中的TF值和IDF值,并对两者求和得到TF-IDF,除以每个待分类词汇在其文档所属的所有文档类别中的TF-IDF之和,获得的商值作为待分类词汇属于文档类别的概率,生成包括待分类词汇、待分类词汇对应的类别和待分类词汇属于对应类别的概率的词汇分类数据库。采用了本发明的技术方案,能够自动完成词汇分类,而且投入很少,效果更加准确。
-
公开(公告)号:CN102955810A
公开(公告)日:2013-03-06
申请号:CN201110249270.2
申请日:2011-08-26
Applicant: 中国移动通信集团公司
IPC: G06F17/30
Abstract: 本发明公开了一种网页分类方法和设备,该方法利用现有URL类别库中的记录,建立虚拟的层级URL,并对层级URL的类别进行预测。当需要对待分类网页进行分类时,根据待分类网页的URL查询URL类别库;如果未查询到匹配的URL,则根据该URL的上层URL查询URL类别库,并在查询到匹配的URL时,根据查询到的URL的预测类别确定待分类网页的类别。在本发明中,提高了网页分类的效率和成功率。
-
公开(公告)号:CN102571321A
公开(公告)日:2012-07-11
申请号:CN201010623542.6
申请日:2010-12-30
Applicant: 中国移动通信集团公司
Abstract: 本发明实施例公开了一种数据加密传输的方法和设备,通过应用本发明实施例所提出的技术方案,在发送端设备和接收端设备上同时设置对称密钥对缓存池,并利用其中的对称密钥信息组进行对称密钥的传输,在发送端设备和接收端设备上的对称密钥对缓存池中保存有相同的对称密钥信息组时,可以节省掉对对称密钥进行分对称解密的时间,提高数据传输的效率。
-
-
-
-