基于预训练语言模型的钓鱼URL检测方法及系统

    公开(公告)号:CN115994224A

    公开(公告)日:2023-04-21

    申请号:CN202310105616.4

    申请日:2023-01-29

    Abstract: 本发明公开一种基于训练语言模型的钓鱼URL检测方法及系统,方法包括:获取URL数据源,构建URL语料库;构建URL分词系统,训练URL分词系统及初始化词嵌入,得到URL初始化子词向量;构建多层网络编码器,基于三元组掩码对多层网络编辑器进行训练,得到模糊掩码语言模型;对模糊掩码语言模型进行微调处理以得到钓鱼URL检测任务模型;将待测URL输入至所述钓鱼URL检测任务模型中,得到检测结果。本发明具有极高的钓鱼网站检测成功率,公开数据评估上识别率达到99%以上;只需要将原始的URL送入到模型中,模型会自动地执行分词、生成词向量、特征提取以及训练;本发明的模型使得准确率提高本发明的模糊掩码语言模型,能够减小预训练的难度。

    一种物联网设备固件解密解析方法、电子设备、介质

    公开(公告)号:CN116522368A

    公开(公告)日:2023-08-01

    申请号:CN202310781574.6

    申请日:2023-06-29

    Applicant: 浙江大学

    Abstract: 本发明公开了一种物联网设备固件解密解析方法、电子设备、介质,包括:获取固件文件;当固件文件被加密时,判断固件文件的加密算法,并采用对应的解密算法和/或解密密钥对固件文件进行解密;当解密后的固件文件为压缩文件时,判定压缩文件对应的压缩算法的类型,对压缩文件进行解压缩;结合Magic签名对解压缩后的固件文件中的固件头、引导程序、内核和根文件系统进行特征标记与识别,依据固件头、引导程序、内核和根文件系统间的关系特征对所识别的固件头、引导程序、内核和根文件系统进行验证;当验证通过后,对固件头、引导程序、内核和根文件系统进行定位、提取及还原。

Patent Agency Ranking