-
公开(公告)号:CN115617979A
公开(公告)日:2023-01-17
申请号:CN202211412461.0
申请日:2022-11-11
申请人: 深圳市检验检疫科学研究院 , 深圳大学 , 深圳前海量子云码科技有限公司
IPC分类号: G06F16/335 , G06F16/35 , G06F16/36 , G06F40/279 , G06F18/214 , G06Q10/0635
摘要: 本发明涉及数据挖掘技术领域,公开了一种基于申报质量评估的海关进出口商品风险识别方法,包括以下步骤:S1、数据预处理:提取要素字段,并进行初步筛选,得到报关单样本集;S2、基于两阶段抽样的报关单样本集抽样:生成候选标记样本集;S3、基于类中心的候选标记样本集删减:得到样本删减后的训练样本集;S4、短文本二分类的报关单质量评估:得到报关单申报正确的概率,完成报关单质量评估。本发明既不过分依赖于某些规则,也不需要消耗大量人工进行审核,可以从海量申报数据中识别监管系统的漏洞,挖掘异常报关行为模式,高效智能化审核报关单,识别申报环节风险,实现自动识别报关单质量并实时预警的功能。
-
公开(公告)号:CN115640400A
公开(公告)日:2023-01-24
申请号:CN202211371246.0
申请日:2022-11-03
申请人: 深圳市检验检疫科学研究院 , 深圳大学
IPC分类号: G06F16/35 , G06F16/36 , G06F40/216 , G06F40/289 , G06Q10/063 , G06Q10/10 , G06Q50/26
摘要: 本发明涉及数据挖掘技术领域,公开了一种海关进出口商品的申报质量评估方法,包括以下步骤:S1、先对报关单数据集进行数据预处理,先通过基于Laplacian图谱的短文本聚类算法,将要素内容聚为若干个簇,并采用水库抽样的方式对每个簇进行抽样;S2、再嵌入基于类中心的样本删减策略,进一步减少候选标记样本集的样本量;S3、采用FastText模型,并引入不等概率的神经元丢弃法,对短文本进行二分类,可以对每张报关单计算要素对应上的平均概率,从而完成海关进出口商品的申报质量评估。本发明既不过分依赖于某些规则,也不需要消耗大量人工进行审核,有效地避免了不规范申报,实现自动识别报关单质量并实时预警的功能,满足了海关监察偷税漏税现象的业务需求。
-
公开(公告)号:CN115641599A
公开(公告)日:2023-01-24
申请号:CN202211371234.8
申请日:2022-11-03
申请人: 深圳市检验检疫科学研究院 , 深圳大学
IPC分类号: G06V30/41 , G06V30/19 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/08 , G06F40/279 , G06F16/36 , G06Q50/26
摘要: 本发明涉及知识图谱技术领域,具体是一种海关进出口商品知识图谱的实体对齐方法,包括如下具体步骤:步骤一:数据处理、步骤二:待对齐商品知识图谱子图的选择、步骤三、商品知识图谱子图对齐方法。发明采用对齐子图的方法,通过Jaccard相似性度量品名和品牌的相似性,将相似性较高的作为待对齐子图,同时训练出一个较为稳定的模型,充分考虑其他要素对品牌和品名的关联性,具有较好的鲁棒性,能适应不同的对齐任务,并高效的找出故意申报较低税率的商品编号的报关单,利用CNN自动提取实体属性信息,并利用GNN进行结构化信息的传播,最终在海关的商品子图得到了不错的结果。
-
-