-
公开(公告)号:CN118364108A
公开(公告)日:2024-07-19
申请号:CN202410537837.3
申请日:2024-04-30
Applicant: 郑州轻工业大学 , 蓝赛数字科技(河南)有限公司
IPC: G06F16/35 , G06F16/33 , G06F40/211 , G06F40/284 , G06F40/30 , G06N3/0499 , G06N3/048
Abstract: 本发明公开了基于大数据技术的网络垃圾数据筛分方法,涉及数据处理技术领域,包括以下步骤:S1:以基于大数据的网络垃圾评论的筛分方法为例,具体以对电商环境中商品的垃圾评论进行筛分,对电商环境中商品的评论信息以及评论用户的信息进行收集,并用特征工程的方法对收集的商品的评论信息以及评论用户的信息的统计特征进行分析和构建,且对收集的商品的评论信息进行预处理。本发明提出了基于大数据技术的网络垃圾数据筛分方法,以对电商环境中商品的垃圾评论进行筛分为例,从垃圾评论检测和垃圾评论用户检测两个方面进行筛分,通过句法分析的方式对收集的商品的评论信息进行初步检测。