-
公开(公告)号:CN111860642A
公开(公告)日:2020-10-30
申请号:CN202010698044.1
申请日:2020-07-20
申请人: 深圳市检验检疫科学研究院 , 深圳海关信息中心 , 深圳海关动植物检验检疫技术中心 , 全国海关信息中心(全国海关电子通关中心)
IPC分类号: G06K9/62
摘要: 本发明实施例提供了一种不均衡样本分类方法及装置,其中一种不均衡样本分类方法包括:获取不均衡样本数据,所述不均衡样本数据包括样本数据和特征数据;利用所述样本数据和所述特征数据计算出样本贡献率;根据所述样本贡献率筛选出预设样本贡献阈值内的样本数据,确定为目标样本数据;将所述目标样本数据输入至样本分类模型中利用优化分类算法计算得到样本分类结果。通过利用特征取值贡献率和特征贡献程度两个变量,来剔除分类贡献度低的特征和样本,有效降低不均衡样本数据的处理,在此基础上利用机器学习算法,采用有效的特征或样本来实现高效的分类,在保证分类质量的前提下,同时提高了分类的效率。
-
公开(公告)号:CN114443909A
公开(公告)日:2022-05-06
申请号:CN202210019006.8
申请日:2022-01-10
申请人: 深圳市检验检疫科学研究院 , 深圳大学 , 深圳海关信息中心
IPC分类号: G06F16/901 , G06F16/906 , G06Q50/00 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明公开了基于社区结构的动态图异常检测方法,包括如下步骤:S1:首先定义动态图异常边检测的具体定义;S2:CmaGraph由C‑Block、M‑Block和A‑Block构成,C‑Block检测动态图的进化社区,M‑Block重建社区内与社区间顶点的距离,使得同一社区内的顶点嵌入之间的欧式距离上互相靠近,位于不同社区的顶点嵌入之间的欧式距离互相远离;S3:顶点嵌入最终输入到A‑Block进行异常检测。本发明在检测异常数据有较好的效果以及社区结构在异常检测的有效性。针对在基于图嵌入方法利用社区结构进行异常检测的研究空白,本发明填补了这方面的研究空白。
-
公开(公告)号:CN114445639A
公开(公告)日:2022-05-06
申请号:CN202210014102.3
申请日:2022-01-06
申请人: 深圳市检验检疫科学研究院 , 深圳大学 , 深圳海关信息中心
摘要: 本发明公开了一种基于双重自注意的动态图异常检测方法,包括如下步骤:S1:DuSAG提取动态图的结构特征和时序特征进行异常边的检测;S2:DuSAG将结构自注意应用于图的随机游走采样得到的顶点序列,使DuSAG能够关注顶点序列中更加重要的顶点,以此增强图的结构特征学习;S3:DuSAG将时序自注意应用在不同时间戳的顶点嵌入上,使DuSAG能够捕获顶点的进化模式,学习图的时序特征。本发明引入结构自注意机制,关注更加重要的顶点,相比NetWalk增强了结构特征的提取。DuSAG引入时序自注意,学习顶点的进化模式,提取时序特征。DuSAG在检测异常数据有较好的效果以及双重自注意在异常检测的有效性。
-
公开(公告)号:CN114328927A
公开(公告)日:2022-04-12
申请号:CN202111655179.0
申请日:2021-12-30
申请人: 深圳市检验检疫科学研究院 , 深圳大学 , 深圳海关信息中心
IPC分类号: G06F16/35 , G06F40/289 , G06N3/04
摘要: 本发明公开了一种基于标签感知的门控循环采集方法,包括如下步骤:S1、混合注意力层:混合注意层计算前一时间步分类预测向量与当前时间步文本词嵌入之间的注意权重;S2、文本特征提取层:使用卷积神经网络来提取文本特征;S3、循环采集层:门控循环单元根据前一时间步的分类结果和当前时间步的文本特征进行分类预测。本发明的分类结果具有更高的F1值(F1score)和更低的汉明损失(Hamming‑loss)。这说明模型的多次重读机制能够提升多标签分类的性能。本发明针对现有多标签分类算法的不足,将多标签分类任务建模为一个循环决策过程,考虑到了标签间的相关性,提升了模型的分类性能。
-
公开(公告)号:CN116467663A
公开(公告)日:2023-07-21
申请号:CN202310384920.7
申请日:2023-04-12
申请人: 深圳市检验检疫科学研究院 , 深圳大学
IPC分类号: G06F18/2433 , G06F18/213 , G06N3/042 , G06N3/0464 , G06N3/0442 , G06N3/045 , G06N3/08
摘要: 本发明提供一种有向动态图数据异常检测方法及系统,涉及异常检测领域。该有向动态图数据异常检测系统,包括基于图角色的有向图卷积网络的动态图异常边检测DDG算法,所述DDG算法可分为基于图角色的有向图卷积网络(RDGCN)、具有传递结构的多头注意力网络和异常检测模块三个模块。通过DDG算法采用了基于有向图角色的图卷积网络RDGCN去提取动态图中的结构特征,以更好地适用于有向动态图数据,并采用具有传递结构的多头注意力网络去提取动态图的时序特征,最后采用有向负采样方法去训练模型,提高了模型在有向图和无向图数据中的异常检测的性能,填补了这方面的研究缺陷。
-
公开(公告)号:CN116204651A
公开(公告)日:2023-06-02
申请号:CN202211251187.3
申请日:2022-10-13
申请人: 深圳市检验检疫科学研究院 , 深圳大学 , 深圳前海量子云码科技有限公司
摘要: 本发明涉及文本挖掘技术领域,公开了一种冷链食品短文本情报主题挖掘系统,包括多知识背景向量构建模块、多知识背景下的相似度度量模块以及相似词增强的吉布斯采样模块,还公开了一种冷链食品短文本情报主题挖掘方法:包括以下步骤:S1、定义符号;S2、多知识背景向量构建S3、相似度度量;S4、吉布斯采样。本发明通过多知识背景向量构建模块将预先训练好的词向量和实体向量融合形成单词的多知识背景向量;通过相似度度量模块计算两个单词的多知识背景向量之间夹角的余弦距离,以确定单词与单词之间的相似性;通过吉布斯采样模块将具有相似知识背景的单词尽可能分配到同一主题下,从而显著提升了短文本情报主题挖掘能力。
-
公开(公告)号:CN116109609A
公开(公告)日:2023-05-12
申请号:CN202310153733.8
申请日:2023-02-23
申请人: 深圳市检验检疫科学研究院 , 深圳大学
IPC分类号: G06T7/00 , G06N3/0464 , G06N3/08
摘要: 本发明涉及图像异常检测技术领域,公开了基于高效动态时间特征嵌入方法的动态图中异常检测方法,包括以下步骤:S1、通过DyTEF提取动态图的结构特征,并将节点映射成高维空间向量;S2、提取块内图的时序特征,并把之前块内图的时序信息迁移到当前块中;S3、得到每条边的异常分数,以找出异常边数据。本发明通过在动态图的时序特征提取上,采用了带有记忆向量多头注意力机制来分块地提取特征,而块内每张图的特征提取都是并行地,这大大提高了算法的并行度,提高了算法效;此外,通过记忆力向量的学习与传递,还能提高算法的保存时序特征的能力,让模型提取时序特征更加的完整,从而提高了异常检测的性能,实现全面地异常检测。
-
公开(公告)号:CN115641599A
公开(公告)日:2023-01-24
申请号:CN202211371234.8
申请日:2022-11-03
申请人: 深圳市检验检疫科学研究院 , 深圳大学
IPC分类号: G06V30/41 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08 , G06F40/279 , G06F16/36 , G06Q50/26
摘要: 本发明涉及知识图谱技术领域,具体是一种海关进出口商品知识图谱的实体对齐方法,包括如下具体步骤:步骤一:数据处理、步骤二:待对齐商品知识图谱子图的选择、步骤三、商品知识图谱子图对齐方法。发明采用对齐子图的方法,通过Jaccard相似性度量品名和品牌的相似性,将相似性较高的作为待对齐子图,同时训练出一个较为稳定的模型,充分考虑其他要素对品牌和品名的关联性,具有较好的鲁棒性,能适应不同的对齐任务,并高效的找出故意申报较低税率的商品编号的报关单,利用CNN自动提取实体属性信息,并利用GNN进行结构化信息的传播,最终在海关的商品子图得到了不错的结果。
-
公开(公告)号:CN115617979A
公开(公告)日:2023-01-17
申请号:CN202211412461.0
申请日:2022-11-11
申请人: 深圳市检验检疫科学研究院 , 深圳大学 , 深圳前海量子云码科技有限公司
IPC分类号: G06F16/335 , G06F16/35 , G06F16/36 , G06F40/279 , G06F18/214 , G06Q10/0635
摘要: 本发明涉及数据挖掘技术领域,公开了一种基于申报质量评估的海关进出口商品风险识别方法,包括以下步骤:S1、数据预处理:提取要素字段,并进行初步筛选,得到报关单样本集;S2、基于两阶段抽样的报关单样本集抽样:生成候选标记样本集;S3、基于类中心的候选标记样本集删减:得到样本删减后的训练样本集;S4、短文本二分类的报关单质量评估:得到报关单申报正确的概率,完成报关单质量评估。本发明既不过分依赖于某些规则,也不需要消耗大量人工进行审核,可以从海量申报数据中识别监管系统的漏洞,挖掘异常报关行为模式,高效智能化审核报关单,识别申报环节风险,实现自动识别报关单质量并实时预警的功能。
-
公开(公告)号:CN113988052A
公开(公告)日:2022-01-28
申请号:CN202111295587.X
申请日:2021-11-03
申请人: 深圳市检验检疫科学研究院 , 合肥工业大学
IPC分类号: G06F40/211 , G06F40/284 , G06N3/04 , G06N3/08
摘要: 本申请提供了一种基于图扰动策略的事件检测方法及装置,包括获取给定句子中的上下文单词,生成与所述上下文单词对应的句法信息邻接矩阵和拼接向量;依据所述句法信息邻接矩阵生成句法图;依据所述拼接向量确定与所述上下文单词对应的上下文表示;将所述句法信息邻接矩阵和所述上下文表示作为人工神经网络的输入,获取输出信息;依据所述上下文表示与所述输出信息预测所述上下文单词的类型。本申请通过引入句法信息和两种图扰动策略来过滤句子中冗余信息,保留重要单词信息,并使用图修复操作减少句法信息的损失,可以有效解决事件检测过程中由于长句子中冗余信息过多所导致的分类效率低下的问题。
-
-
-
-
-
-
-
-
-