-
公开(公告)号:CN112163145A
公开(公告)日:2021-01-01
申请号:CN202011073066.5
申请日:2020-10-09
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06F16/9532 , G06F16/951 , G06F16/35 , G06F40/247 , G06F40/284 , G06F40/289 , G06K9/62
Abstract: 本申请公开了一种基于编辑距离与余弦夹角的网站检索方法,由于文本向量的余弦夹角计算相对编辑距离计算速度更快,而相对编辑距离衡量文本相似度准确性更高,为了充分利用两者的优势,该方法利用K‑means方法对文本向量聚类,其中K‑means方法使用向量之间的余弦夹角作为衡量相似度的依据;当获取到检索信息之后,先确定检索信息归属的簇,再在该簇内使用编辑距离衡量簇内标题与检索信息之间的相似性,缩小了待计算的范围,提升了网站检索的实时性与准确性。此外,本申请还提供了一种基于编辑距离与余弦夹角的网站检索装置、设备及可读存储介质,其技术效果与上述方法的技术效果相对应。
-
公开(公告)号:CN112163145B
公开(公告)日:2024-01-30
申请号:CN202011073066.5
申请日:2020-10-09
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06F16/9532 , G06F16/951 , G06F16/35 , G06F40/247 , G06F40/284 , G06F40/289
Abstract: 本申请公开了一种基于编辑距离与余弦夹角的网站检索方法,由于文本向量的余弦夹角计算相对编辑距离计算速度更快,而相对编辑距离衡量文本相似度准确性更高,为了充分利用两者的优势,该方法利用K‑means方法对文本向量聚类,其中K‑means方法使用向量之间的余弦夹角作为衡量相似度的依据;当获取到检索信息之后,先确定检索信息归属的簇,再在该簇内使用编辑距离衡量簇内标题与检索信息之间的相似性,缩小了待计算的范围,提升了网站检索的实时性与准确性。此外,本申请还提供了一种基于编辑距离与余弦夹角的网站检索装置、设备及可读存储介质,其技术效果与上述方法的技术效果相对应。
-
公开(公告)号:CN115359468A
公开(公告)日:2022-11-18
申请号:CN202210974175.7
申请日:2022-08-15
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06V20/60 , G06V10/46 , G06V10/764 , G06V10/774 , G06F16/951 , G06F16/958
Abstract: 本申请公开了一种目标网站识别方法、装置、设备及介质,涉及图像识别技术领域,包括:对获取到的样本网站图片进行预处理,并基于预处理后的样本网站图片构建训练样本集;其中,样本网站图片包括目标类型图片和其他类型图片;对训练样本集中每一所述样本网站图片进行SIFT特征检测以得到相应的SIFT特征向量,并将SIFT特征向量输入至全连接卷积神经网络中进行学习训练以得到图片分类模型;获取待识别网站图片,并将待识别网站图片输入图片分类模型以得到相应的图片分类概率分布,然后基于图片分类概率分布确定出待识别网站的网站类型。通过结合SIFT特征检测和卷积神经网络的方式对待识别网站图片进行识别,提高了目标网站的识别速度以及识别结果的准确率。
-
公开(公告)号:CN113962324A
公开(公告)日:2022-01-21
申请号:CN202111300201.X
申请日:2021-11-04
Applicant: 杭州安恒信息技术股份有限公司
IPC: G06K9/62 , G06N3/04 , G06F40/216 , G06V10/762 , G06V10/764 , G06V10/82
Abstract: 本申请涉及一种图片检测方法、装置、存储介质及电子设备,该方法包括:获取图片和所述图片的文本信息;通过聚类模型对所述文本信息进行聚类,根据聚类结果确定所述图片所属的聚类簇;根据所述聚类簇的安全性标签确定所述图片是否属于疑似预设类型的图片,所述安全性标签用于记录所述聚类簇是否为疑似预设类型图片的信息;若是,将所述图片输入至神经网络模型中,以通过所述神经网络模型对所述图片进行图片类型分类;根据所述神经网络模型输出的分类结果确定所述图片是否为预设类型的图片。本发明通过聚类方法进行图片的初步筛选,以节省计算资源,再利用神经模型进行精确判断,提高了检测准确率。
-
-
-