一种短文本框聚类方法、系统、设备及存储介质

    公开(公告)号:CN112860898B

    公开(公告)日:2022-05-27

    申请号:CN202110279525.3

    申请日:2021-03-16

    Abstract: 本发明涉及一种短文本框聚类方法、系统、设备及存储介质,该方法包括:对原始短文本进行预处理;提取短文本特征词;将短文本特征词转换为短文本特征向量;先初始化聚类中心,然后将聚类中心映射到LSH表中;再根据短文本到聚类中心的文本相似度,选择若干个候选类;根据哈希值选择短文本特征向量的簇集合;重新计算短文本特征向量的簇集合的新聚类中心;循环执行直到新聚类中心不再发生变化,输出文本聚类结果。本发明中,采用WMD‑IP距离作为文本相似度,考虑词向量的位置,这样便可更充分的利用词语的语义信息,减少中间计算过程的复杂度,提高短文本框聚类结果的精度。

    一种基于动态阈值的序列模式挖掘方法及其用途

    公开(公告)号:CN110609857A

    公开(公告)日:2019-12-24

    申请号:CN201910811085.4

    申请日:2019-08-30

    Abstract: 本发明属于数据处理技术领域,涉及一种序列模式的挖掘方法。该方法包括:利用时间窗口对原始序列进行划分,形成时间序列集;扫描时间序列集,获取一项式集合;根据频繁一项式定义采用动态阈值对一项式进行筛选,将非频繁的项从序列集中删除,得到频繁一项式集;从频繁一项式集中的第一项开始以所述的第一项为前缀构造后缀,对后缀进行频繁多项式的挖掘,满足频繁多项式定义的项为频繁项,当后缀为空时,挖掘结束;遍历频繁一项式集合,迭代进行上一步操作,直到频繁一项式集合被遍历完成,得到频繁项集合。本发明的方法,在识别频繁一项式时,采用了动态变化的支持度阈值;不仅对不同序列之间频繁出现的模式进行挖掘,也挖掘一个序列内部频繁出现的模式。

    一种面向情报分析的人机交互系统及其数据处理方法

    公开(公告)号:CN110363586A

    公开(公告)日:2019-10-22

    申请号:CN201910594639.X

    申请日:2019-07-03

    Abstract: 本发明公开了一种面向情报分析的人机交互系统及其数据处理方法,所述系统包括人机交互界面、数据输入模块、数据获取模块、数据处理模块、数据分析模块、结果展示模块,所述数据输入模块用于为用户提供输入接口;所述数据获取模块采用信息爬取方式获取情报信息,数据获取方式包括但不限于通用搜索、新闻搜索、社交搜索、论坛搜索、本地搜索、暗网搜索、学者搜索、企业搜索;所述数据处理模块用于对获取的情报信息进行数据处理,提高情报信息的质量,并保存处理结果;所述数据分析模块用于深入挖掘情报,并将挖掘结果交给结果展示模块进行可视化展示。本发明实现数据处理可视化,提高情报分析的准确性。

    一种钓鱼网站检测方法
    27.
    发明授权

    公开(公告)号:CN104166725B

    公开(公告)日:2018-01-12

    申请号:CN201410422615.3

    申请日:2014-08-26

    Abstract: 本发明实施例公开一种钓鱼网站检测方法,应用于计算机网络领域,以解决现有的检测钓鱼网站不能主动检测、误报、漏报、不及时的问题。该方法包括:建立待测网页对应的基于视觉内容的特征向量;将特征向量与预设的特征向量集合里的特征向量进行比对;根据比对结果判断待测网页是否是钓鱼网站。本发明实施例适用于钓鱼网站检测。

    一种钓鱼网站引擎探测方法及装置

    公开(公告)号:CN104113539A

    公开(公告)日:2014-10-22

    申请号:CN201410332426.7

    申请日:2014-07-11

    Abstract: 本发明实施例公开一种钓鱼网站引擎探测方法及装置,应用于通信领域,能够解决现有的探测钓鱼网站引擎不及时只能对钓鱼网站被动防御的问题。该方法包括:对保护列表信息进行域名变换,获得变换后的域名;将变换后的域名进行DNS解析,以获得可疑域名;将可疑域名进行URL检测,以获得可疑URL信息;根据可疑URL信息探测钓鱼网站引擎。本发明的实施例应用于探测钓鱼网站。

    公交查询系统
    30.
    发明授权

    公开(公告)号:CN114756596B

    公开(公告)日:2024-11-05

    申请号:CN202210240866.4

    申请日:2022-03-10

    Abstract: 本发明涉及公交查询技术领域,且公开了公交查询系统,包括管理模块、该管理模块与查询系统电性连接,该管理模块外侧具有查询模块,该查询模块与该查询系统电性连接,该管理模块用于储存公交线路,该查询模块包括模糊查询站点、查询换乘最少、查询站数最少以及显示路线地图,该模糊查询站点、查询换乘最少、查询站数最少以及显示路线地图均与该查询模块电性连接,在一种可能的实施方式中,模糊查询站点:用户通过给出关键字来识别是否含有相关站点,以方便用户后续通过输入期望到达的起始站和终点站来搜索到符合自己期望的路线,解决现有技术中算法不够先进,查询方式多采用分类讨论的方式进行查询等问题。

Patent Agency Ranking