网站分类方法、装置、分类设备及存储介质

    公开(公告)号:CN115374325A

    公开(公告)日:2022-11-22

    申请号:CN202210614028.9

    申请日:2022-05-31

    Abstract: 本发明实施例涉及一种网站分类方法、装置、分类设备及存储介质,所述方法包括:在提取网站中的文本信息时,对所述文本信息进行预处理,获得文本数据集;在提取网站中的图像信息时,对所述图像信息进行预处理,获得图像数据集;对所述文本数据集进行特征提取,获得文本特征向量;对所述图像数据集进行特征提取,获得图像特征向量;基于Bert‑ResNet融合模型对获取的所述文本特征向量和所述图像特征向量进行信息融合,得到相应的融合结果,所述融合结果表征所述网站的分类结果;通过将文本信息和图像信息在Bert‑ResNet融合模型中进行融合处理,实现文本信息和图像信息互补的多模态网站分类处理,提高网站分类的准确率的技术效果。

    一种用户行为分析方法和系统

    公开(公告)号:CN113157540A

    公开(公告)日:2021-07-23

    申请号:CN202110348169.6

    申请日:2021-03-31

    Abstract: 本发明提出了一种用户行为分析方法和系统。所述用户行为分析方法,包括以下步骤:从网络日志中提取主体域名数据;再根据主体域名数据,获取对应的HTML文件;通过该HTML文件建立对应的平台词条;根据主体域名数据访问对应主体,抓取因访问而产生的日志流量包;通过DPI技术对日志流量包进行拆解,对拆解后得到的数据提取关键词,并根据关键词在一级词库中建立对应的行为词条;对关键词单位时间内出现的频次进行统计,并对同义词进行归并统一,从而在二级词库中建立对应的行为属性词条;整合所建立的平台词条、行为词条以及行为属性词条,从而判断出用户行为。本发明的用户行为分析方法和系统设计新颖,实用性强。

Patent Agency Ranking