-
公开(公告)号:CN111858953A
公开(公告)日:2020-10-30
申请号:CN202010514456.5
申请日:2020-06-08
申请人: 北京邮电大学 , 中国雄安集团数字城市科技有限公司 , 中国联合网络通信有限公司
IPC分类号: G06F16/36
摘要: 本发明实施例提供一种用于智慧城市少样本数据建模的实体关系表示方法及系统,该方法包括:获取智慧城市数据的支持集和查询集,并通过非线性映射ReLU,将支持集和查询集的语义表示映射到对应的通路中;通过类内信息通路,对支持集中每个类别映射后的实例信息进行交互处理;通过类间信息通路,对支持集中所有类别映射后的整体信息进行交互处理;通过支持集-查询集信息通路,对支持集映射后的所有实例和所述查询集映射后的所有实例进行信息交互。本发明实施例通过多通路并行处理的方式保留更全面的信息,丰富实体关系类别的文本表示,提高类别知识迁移的信息量,提取更多有价值的特征,更准确地表示实体关系类别的支持集与查询集。
-
公开(公告)号:CN113657428B
公开(公告)日:2023-07-14
申请号:CN202110734331.8
申请日:2021-06-30
申请人: 北京邮电大学 , 中国雄安集团数字城市科技有限公司 , 国网河南省电力公司信息通信公司
IPC分类号: G06F18/214 , G06F18/2321 , G06F18/2413
摘要: 本发明提供一种网络流量数据的抽取方法及装置,方法包括:根据原始网络流量数据集中样本的样本密度信息,确定样本所属类别的类密度信息;根据所述类密度信息,确定样本信息量和类信息量;根据所述样本信息量和所述类信息量,确定抽取的代表样本集。所述装置用于执行上述方法。本发明通过根据原始网络流量数据集中的样本的信息携带量来计算类的信息携带量,依照样本信息量和类信息量来抽取用于合成的代表样本,解决了只依靠多数类和少数类的数量比难以表明两者之间信息不平衡的问题。
-
公开(公告)号:CN113507447A
公开(公告)日:2021-10-15
申请号:CN202110671353.4
申请日:2021-06-17
申请人: 北京邮电大学 , 中国雄安集团数字城市科技有限公司
摘要: 本发明提供一种网络流量数据的自适应增强方法及装置,方法包括:基于层次凝聚聚类HAC算法对原始网络流量数据集进行聚类,并根据不平衡比确定少数类聚类;获取少数类聚类中少数类样本的稀疏度权重和数量权重;根据稀疏度权重和数量权重,确定少数类合成样本数量;基于过采样算法和少数类合成样本数量,对原始网络流量数据集进行数据增强。所述装置用于执行上述方法。本发明利用HAC聚类算法不需要参数的特性,减少需要预先设置的参数,降低噪声的影响,并且提出根据聚类中样本稀疏度和样本数量比例分配每个聚类合成样本数量的方案,能够自适应分配每个聚类需要合成新样本的数量,解决了现有技术中合成样本依赖信息不足的问题。
-
公开(公告)号:CN113657429B
公开(公告)日:2023-07-07
申请号:CN202110736231.9
申请日:2021-06-30
申请人: 北京邮电大学 , 中国雄安集团数字城市科技有限公司
摘要: 本发明提供一种面向数字孪生城市物联网的数据融合方法及装置,方法包括:获取物联网终端的异常类别的完整命题识别框架和物联网终端的系统属性数据支持度;根据完整命题识别框架中各个命题的支持区间,将系统属性数据支持度转化为DS证据理论中的证据;基于有序加权平均OWA算子融合证据。所述装置用于执行上述方法。本发明根据物联网应用终端构建完整命题识别框架及系统属性数据支持度,基于完整命题识别框架中各命题的支持区间,将系统属性数据支持度转化为证据后应用OWA算子完成数据的融合,有效解决证据之间存在较大冲突问题的同时,保证了冲突证据持有一定权重,能够显著提高对物联网终端异常预测的准确性和可靠性。
-
公开(公告)号:CN111858953B
公开(公告)日:2022-10-18
申请号:CN202010514456.5
申请日:2020-06-08
申请人: 北京邮电大学 , 中国雄安集团数字城市科技有限公司 , 中国联合网络通信集团有限公司
IPC分类号: G06F16/36
摘要: 本发明实施例提供一种用于智慧城市少样本数据建模的实体关系表示方法及系统,该方法包括:获取智慧城市数据的支持集和查询集,并通过非线性映射ReLU,将支持集和查询集的语义表示映射到对应的通路中;通过类内信息通路,对支持集中每个类别映射后的实例信息进行交互处理;通过类间信息通路,对支持集中所有类别映射后的整体信息进行交互处理;通过支持集‑查询集信息通路,对支持集映射后的所有实例和所述查询集映射后的所有实例进行信息交互。本发明实施例通过多通路并行处理的方式保留更全面的信息,丰富实体关系类别的文本表示,提高类别知识迁移的信息量,提取更多有价值的特征,更准确地表示实体关系类别的支持集与查询集。
-
公开(公告)号:CN113657428A
公开(公告)日:2021-11-16
申请号:CN202110734331.8
申请日:2021-06-30
申请人: 北京邮电大学 , 中国雄安集团数字城市科技有限公司 , 国网河南省电力公司信息通信公司
IPC分类号: G06K9/62
摘要: 本发明提供一种网络流量数据的抽取方法及装置,方法包括:根据原始网络流量数据集中样本的样本密度信息,确定样本所属类别的类密度信息;根据所述类密度信息,确定样本信息量和类信息量;根据所述样本信息量和所述类信息量,确定抽取的代表样本集。所述装置用于执行上述方法。本发明通过根据原始网络流量数据集中的样本的信息携带量来计算类的信息携带量,依照样本信息量和类信息量来抽取用于合成的代表样本,解决了只依靠多数类和少数类的数量比难以表明两者之间信息不平衡的问题。
-
公开(公告)号:CN114756546A
公开(公告)日:2022-07-15
申请号:CN202210323380.7
申请日:2022-03-29
申请人: 北京邮电大学 , 中国雄安集团数字城市科技有限公司 , 中国联合网络通信集团有限公司
IPC分类号: G06F16/22 , G06F16/906 , G06F17/11 , G06F17/16
摘要: 本发明提供一种智慧城市融合网络运维数据特征提取和分析方法,所述方法包括:对目标向量进行聚类,确定邻域图;所述目标向量是基于智慧城市融合网络运维数据确定的;基于所述邻域图,确定特征向量。本发明提供的智慧城市融合网络运维数据特征提取和分析方法,通过对目标向量进行聚类,基于聚类后的向量确定邻域图,构建权值矩阵,再求解广义特征向量,并使用特征向量组成的映射矩阵,将高维度的向量映射为低纬度,实现了向量嵌入降维,完成特征提取,提高数据特征提取的可靠性和准确性。
-
公开(公告)号:CN113657429A
公开(公告)日:2021-11-16
申请号:CN202110736231.9
申请日:2021-06-30
申请人: 北京邮电大学 , 中国雄安集团数字城市科技有限公司
IPC分类号: G06K9/62
摘要: 本发明提供一种面向数字孪生城市物联网的数据融合方法及装置,方法包括:获取物联网终端的异常类别的完整命题识别框架和物联网终端的系统属性数据支持度;根据完整命题识别框架中各个命题的支持区间,将系统属性数据支持度转化为DS证据理论中的证据;基于有序加权平均OWA算子融合证据。所述装置用于执行上述方法。本发明根据物联网应用终端构建完整命题识别框架及系统属性数据支持度,基于完整命题识别框架中各命题的支持区间,将系统属性数据支持度转化为证据后应用OWA算子完成数据的融合,有效解决证据之间存在较大冲突问题的同时,保证了冲突证据持有一定权重,能够显著提高对物联网终端异常预测的准确性和可靠性。
-
公开(公告)号:CN113297373A
公开(公告)日:2021-08-24
申请号:CN202110642261.3
申请日:2021-06-09
申请人: 北京邮电大学 , 中国雄安集团数字城市科技有限公司 , 中国联合网络通信集团有限公司
IPC分类号: G06F16/335 , G06F16/35 , G06F40/295 , G06F40/30 , G06F17/16 , G06N3/04 , G06N3/08
摘要: 本发明实施例提供一种智慧城市主题信息抽取方法、装置、电子设备和存储介质。该方法包括:将待抽取的智慧城市主题文本输入至预训练模型,输出智慧城市主题文本特征矩阵;基于文本特征矩阵,确定头实体位置特征矩阵和尾实体位置特征矩阵;其中,实体为被识别的目标单词,头实体位置特征矩阵和尾实体位置特征矩阵表示待抽取文本中单词与实体的相对位置关系;基于头实体位置特征矩阵和尾实体位置特征矩阵,确定面向智慧城市主题的简洁文本特征矩阵;基于简洁文本特征矩阵确定待抽取文本中的实体关系。本发明实施例通过将智慧城市主题的外部语料的绝对位置信息迁移至实体关系抽取具体任务,并通过降噪处理缓解噪声与误标注数据对模型参数更新的干扰,提升智慧城市知识图谱的实体关系抽取精度。
-
公开(公告)号:CN113507447B
公开(公告)日:2022-09-13
申请号:CN202110671353.4
申请日:2021-06-17
申请人: 北京邮电大学 , 中国雄安集团数字城市科技有限公司
摘要: 本发明提供一种网络流量数据的自适应增强方法及装置,方法包括:基于层次凝聚聚类HAC算法对原始网络流量数据集进行聚类,并根据不平衡比确定少数类聚类;获取少数类聚类中少数类样本的稀疏度权重和数量权重;根据稀疏度权重和数量权重,确定少数类合成样本数量;基于过采样算法和少数类合成样本数量,对原始网络流量数据集进行数据增强。所述装置用于执行上述方法。本发明利用HAC聚类算法不需要参数的特性,减少需要预先设置的参数,降低噪声的影响,并且提出根据聚类中样本稀疏度和样本数量比例分配每个聚类合成样本数量的方案,能够自适应分配每个聚类需要合成新样本的数量,解决了现有技术中合成样本依赖信息不足的问题。
-
-
-
-
-
-
-
-
-