-
公开(公告)号:CN113507447A
公开(公告)日:2021-10-15
申请号:CN202110671353.4
申请日:2021-06-17
Applicant: 北京邮电大学 , 中国雄安集团数字城市科技有限公司
Abstract: 本发明提供一种网络流量数据的自适应增强方法及装置,方法包括:基于层次凝聚聚类HAC算法对原始网络流量数据集进行聚类,并根据不平衡比确定少数类聚类;获取少数类聚类中少数类样本的稀疏度权重和数量权重;根据稀疏度权重和数量权重,确定少数类合成样本数量;基于过采样算法和少数类合成样本数量,对原始网络流量数据集进行数据增强。所述装置用于执行上述方法。本发明利用HAC聚类算法不需要参数的特性,减少需要预先设置的参数,降低噪声的影响,并且提出根据聚类中样本稀疏度和样本数量比例分配每个聚类合成样本数量的方案,能够自适应分配每个聚类需要合成新样本的数量,解决了现有技术中合成样本依赖信息不足的问题。
-
公开(公告)号:CN113507447B
公开(公告)日:2022-09-13
申请号:CN202110671353.4
申请日:2021-06-17
Applicant: 北京邮电大学 , 中国雄安集团数字城市科技有限公司
Abstract: 本发明提供一种网络流量数据的自适应增强方法及装置,方法包括:基于层次凝聚聚类HAC算法对原始网络流量数据集进行聚类,并根据不平衡比确定少数类聚类;获取少数类聚类中少数类样本的稀疏度权重和数量权重;根据稀疏度权重和数量权重,确定少数类合成样本数量;基于过采样算法和少数类合成样本数量,对原始网络流量数据集进行数据增强。所述装置用于执行上述方法。本发明利用HAC聚类算法不需要参数的特性,减少需要预先设置的参数,降低噪声的影响,并且提出根据聚类中样本稀疏度和样本数量比例分配每个聚类合成样本数量的方案,能够自适应分配每个聚类需要合成新样本的数量,解决了现有技术中合成样本依赖信息不足的问题。
-
公开(公告)号:CN111046178B
公开(公告)日:2023-06-20
申请号:CN201911200922.6
申请日:2019-11-29
Applicant: 北京邮电大学 , 北京智芯微电子科技有限公司 , 国网河北省电力有限公司信息通信分公司
IPC: G06F16/35 , G06F40/205 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/0475 , G06N3/094
Abstract: 本发明实施例提供的文本序列生成方法及其系统,包括:对抗网络模型包括生成器和判别器;生成器中包含特征反馈网络模块,用于从判别器中调取高阶特征,以生成指导特征向量;生成器基于指导特征向量,生成预输出文本序列的下一个词;判别器根据新构建的预输出文本序列和初始文本序列更新高阶特征;迭代执行上述步骤,直至新构建的预生成文本序列的总词数达到设定阈值时,输入至判别器进行判别,并根据分类判别结果计算更新梯度;根据更新梯度更新生成器的参数;迭代执行上述步骤直至生成器和判别器均收敛后,输出目标文本序列。本发明实施例通过增添特征转换反馈模块,将判别器提取到的特征向量输送至生成器作为指导信号,改善了生成器的生成质量。
-
公开(公告)号:CN111626376A
公开(公告)日:2020-09-04
申请号:CN202010515089.0
申请日:2020-06-08
Applicant: 北京邮电大学
IPC: G06K9/62
Abstract: 本发明实施例提供的基于判别联合概率的域适配方法及系统,包括获取历史流量数据集;根据历史流量数据集,构建带标签的源域数据集和带标签的目标域数据集;根据带标签的源域数据集和带标签的目标域数据集,计算源域和目标域之间的联合概率差异;根据联合概率差异获取最小化联合概率差异;基于最小化联合概率差异,将带标签的源域数据集向带标签的目标域数据集进行域适配。本发明实施例提供的域适配方法及系统,通过直接计算最小化联合概率差异,度量边际分布和条件分布的差异,构造了对实质分布差异有效且鲁棒的特征表示,提高了域的可转移性和类的可识别性。
-
公开(公告)号:CN111046178A
公开(公告)日:2020-04-21
申请号:CN201911200922.6
申请日:2019-11-29
Applicant: 北京邮电大学 , 北京智芯微电子科技有限公司 , 国网河北省电力有限公司信息通信分公司
IPC: G06F16/35 , G06F40/205 , G06N3/04
Abstract: 本发明实施例提供的文本序列生成方法及其系统,包括:对抗网络模型包括生成器和判别器;生成器中包含特征反馈网络模块,用于从判别器中调取高阶特征,以生成指导特征向量;生成器基于指导特征向量,生成预输出文本序列的下一个词;判别器根据新构建的预输出文本序列和初始文本序列更新高阶特征;迭代执行上述步骤,直至新构建的预生成文本序列的总词数达到设定阈值时,输入至判别器进行判别,并根据分类判别结果计算更新梯度;根据更新梯度更新生成器的参数;迭代执行上述步骤直至生成器和判别器均收敛后,输出目标文本序列。本发明实施例通过增添特征转换反馈模块,将判别器提取到的特征向量输送至生成器作为指导信号,改善了生成器的生成质量。
-
公开(公告)号:CN111782805A
公开(公告)日:2020-10-16
申请号:CN202010549098.1
申请日:2020-06-16
Applicant: 北京邮电大学
Abstract: 本发明实施例提供一种文本标签分类方法及系统。该方法包括:获取待分类文本集;将待分类文本集输入至文本标签分类模型,得到文本标签分类模型输出的文本标签分类结果;文本标签分类模型是由文本样本集,基于注意力机制对卷积神经网络模型进行评估,并结合主损失函数与双目标辅助损失函数对卷积神经网络模型进行优化得到的。本发明实施例通过在文本标签分类过程中,使用主损失函数和双目标辅助损失函数进行联合优化,将实体关系类别的类内聚合程度与类间远离程度作为奖励项添加到梯度计算中,使得实体关系类别在度量空间中更加分散,类别内更加紧密,并且实现收敛模型迁移到少样本类别中,在信息不足的情况下更加快速地对少样本类别进行空间划分。
-
-
-
-
-