-
公开(公告)号:CN109033148A
公开(公告)日:2018-12-18
申请号:CN201810599969.3
申请日:2018-06-11
Applicant: 广州大学
IPC: G06F17/30
Abstract: 本发明公开一种面向多分类的不平衡数据预处理方法、装置、设备,方法包括:接收最终样本集大小及样例集的不平衡比,得出每个类别的理想样例个数;根据理想样例个数和实际样例个数判断少数类样例集和多数类样例集;对少数类样例集中的样例,计算k近邻中其他类样例和少数类样例的个数,以分类标记;对少数类样例集中的样例,根据样例的标记进行删除、保存、复制或合成,得到最终少数类样例集;对多数类样例集中的样例,计算k近邻中该多数类样例和其他类样例的个数,以分类标记;对多数类样例集中的样例,根据样例的标记进行删除或保存,得到最终多数类样例集;生成最终样本集。本发明使得最终样本集能有效提高多分类算法的准确性。
-
公开(公告)号:CN110493817A
公开(公告)日:2019-11-22
申请号:CN201910779183.4
申请日:2019-08-22
Applicant: 广州大学
Abstract: 本发明公开了一种基于代表对象的数据流监控方法及装置、介质和设备,包括:获取无线传感网络中各节点上对象的初始局部值;计算各个对象的当前全局值;选取出代表对象和异常对象,跟踪监控代表对象和异常对象在各节点上的数据流;判定代表对象在各节点上是否具有最大局部值,不具有则调整,使代表对象在各节点上具有最大局部值;各节点实时监测其自身数据流,实时获取各对象在该节点上的当前局部值,在代表对象在该节点上的当前局部值不为该节点上的最大局部值情况下,判定代表对象当前全局值是否为最大全局值,不是则重新获取代表对象;是则调整,使代表对象在各节点上具有最大局部值;本发明方法可以有效降低监控数据流的通信开销和功耗。
-
公开(公告)号:CN108647728A
公开(公告)日:2018-10-12
申请号:CN201810453104.6
申请日:2018-05-10
Applicant: 广州大学
Abstract: 本发明公开了一种不平衡数据分类过采样方法,包括:获取待处理不平衡数据中的所有少数样例;根据K近邻算法获取每一所述少数样例最近邻的k个样例中多数样例的个数;根据所述多数样例的个数确定对应少数样例的类别;根据每一所述少数样例的类别进行与所述类别对应的操作。增加少数样例的多样性,避免因少数类样例少导致分类学习算法精度低,解决少数类样例缺失的问题。
-
公开(公告)号:CN110493817B
公开(公告)日:2023-01-06
申请号:CN201910779183.4
申请日:2019-08-22
Applicant: 广州大学 , 中国人民解放军国防科技大学
Abstract: 本发明公开了一种基于代表对象的数据流监控方法及装置、介质和设备,包括:获取无线传感网络中各节点上对象的初始局部值;计算各个对象的当前全局值;选取出代表对象和异常对象,跟踪监控代表对象和异常对象在各节点上的数据流;判定代表对象在各节点上是否具有最大局部值,不具有则调整,使代表对象在各节点上具有最大局部值;各节点实时监测其自身数据流,实时获取各对象在该节点上的当前局部值,在代表对象在该节点上的当前局部值不为该节点上的最大局部值情况下,判定代表对象当前全局值是否为最大全局值,不是则重新获取代表对象;是则调整,使代表对象在各节点上具有最大局部值;本发明方法可以有效降低监控数据流的通信开销和功耗。
-
公开(公告)号:CN110365546A
公开(公告)日:2019-10-22
申请号:CN201910779193.8
申请日:2019-08-22
Applicant: 广州大学
Abstract: 本发明公开了一种节点数据流的监控方法、存储介质和计算设备,根据各对象的全局值选取出代表对象和异常对象;确定节点性质,在不满足第一条件的情况下跟踪监控代表对象和异常对象在各节点上的数据流,在代表对象在各节点上的局部值不为最大局部值的情况下,通过初始调整因子设定方法使代表对象在各节点上具有最大局部值;然后控制各节点实时监测其自身数据流,当代表对象在各节点上的局部值不为最大局部值时,若代表对象不具有最大全局值,则重新选取代表对象,若代表对象具有最大全局值,则通过运行调整因子设定方法使代表对象在各节点上具有最大局部值;本发明方法可以有效降低监控节点数据流的通信开销和功耗。
-
公开(公告)号:CN108647728B
公开(公告)日:2019-04-19
申请号:CN201810453104.6
申请日:2018-05-10
Applicant: 广州大学
Abstract: 本发明公开了一种不平衡数据分类过采样方法,包括:获取待处理不平衡数据中的所有少数样例;根据K近邻算法获取每一所述少数样例最近邻的k个样例中多数样例的个数;根据所述多数样例的个数确定对应少数样例的类别;根据每一所述少数样例的类别进行与所述类别对应的操作。增加少数样例的多样性,避免因少数类样例少导致分类学习算法精度低,解决少数类样例缺失的问题。
-
公开(公告)号:CN109558546A
公开(公告)日:2019-04-02
申请号:CN201811315209.1
申请日:2018-11-06
Applicant: 广州大学
IPC: G06F16/9536 , G06Q50/00
Abstract: 本发明一种基于行为分析的微博话题表示模型生成方法及装置,该方法包括:步骤S1,将微博用户发布、转发及评论的文档结合在一起生成用户文档集合;步骤S2,对用户文档集合采用LDA模型生成话题模型;步骤S3,对每个话题的每个词项,计算基于行为分析的词项内部权重;步骤S4,对用户文档集合中的每个词项,计算基于行为分析的词项外部权重;步骤S5,根据得到的权重计算每个话题下每个词项的基于行为分析的综合权重;步骤S6,根据获得的综合权重对每个话题计算基于行为分析的话题表示模型,本发明通过于话题模型中结合用户行为因素,可提高后续使用话题模型进行话题发现、演化分析等的准确度。
-
公开(公告)号:CN108694413A
公开(公告)日:2018-10-23
申请号:CN201810453102.7
申请日:2018-05-10
Applicant: 广州大学
IPC: G06K9/62
CPC classification number: G06K9/6267
Abstract: 本发明公开了一种自适应采样不平衡数据分类处理方法,包括:获取目标多数样例个数和目标少数样例个数;根据所述目标多数样例个数和所述目标少数样例个数对待处理不平衡数据进行自适应采样数据处理,以使得处理后的所述待处理不平衡数据中的多数样例个数满足所述目标多数样例个数,处理后的所述待处理不平衡数据中的少数样例个数满足所述目标少数样例个数;其中,所述自适应采样数据处理包括过采样和欠采样。根据用户的个人需求,结合使用过采样和欠采样技术,使得新生成的样例集满足分类算法对数据的需求,提高不平衡大数据的分类准确性。
-
公开(公告)号:CN110365546B
公开(公告)日:2022-03-22
申请号:CN201910779193.8
申请日:2019-08-22
Applicant: 广州大学
IPC: H04L41/0681 , H04L43/16 , H04L67/12 , H04W4/38
Abstract: 本发明公开了一种节点数据流的监控方法、存储介质和计算设备,根据各对象的全局值选取出代表对象和异常对象;确定节点性质,在不满足第一条件的情况下跟踪监控代表对象和异常对象在各节点上的数据流,在代表对象在各节点上的局部值不为最大局部值的情况下,通过初始调整因子设定方法使代表对象在各节点上具有最大局部值;然后控制各节点实时监测其自身数据流,当代表对象在各节点上的局部值不为最大局部值时,若代表对象不具有最大全局值,则重新选取代表对象,若代表对象具有最大全局值,则通过运行调整因子设定方法使代表对象在各节点上具有最大局部值;本发明方法可以有效降低监控节点数据流的通信开销和功耗。
-
公开(公告)号:CN108647727A
公开(公告)日:2018-10-12
申请号:CN201810453103.1
申请日:2018-05-10
Applicant: 广州大学
IPC: G06K9/62
CPC classification number: G06K9/6256 , G06K9/6276
Abstract: 本发明公开了一种不平衡数据分类欠采样方法,包括:获取待处理不平衡数据中的所有多数样例;根据K近邻算法获取每一所述多数样例最近邻的k个样例中少数样例的个数;根据所述少数样例的个数确定对应多数样例的类别;根据每一所述多数样例的类别进行与所述类别对应的操作。解决不平衡大数据分类过程中多数类样例过多和少数样例过少导致的分类学习算法精度低的问题,提高不平衡大数据的分类准确性。
-
-
-
-
-
-
-
-
-