-
公开(公告)号:CN111858649B
公开(公告)日:2022-06-17
申请号:CN202010779077.9
申请日:2020-08-05
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F16/245 , G06F16/25 , G06F16/28 , G06K9/62
Abstract: 本发明涉及一种基于本体映射的异构数据融合方法,属于数据处理技术领域,通过数据库系统情况,构建元数据字典,进一步得出局部本体模型,然后对局部模式下本体和全局本体进行相似度计算,得到相似度,根据相似度判断出融合情况,将数据进行映射,实现异构数据融合。本发明通过先建立元数据字典的形式将数据字段进行标准化,然后利用图卷积网络自动学习计算出相似度,省去了数学计算的所带来的误差,准确率更高,最后通过制定的映射规则进行字段映射,避免了低效率的人工筛选,精准映射,数据融合匹配度更高。
-
公开(公告)号:CN112860898B
公开(公告)日:2022-05-27
申请号:CN202110279525.3
申请日:2021-03-16
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/35 , G06F40/216 , G06F40/289 , G06F40/30
Abstract: 本发明涉及一种短文本框聚类方法、系统、设备及存储介质,该方法包括:对原始短文本进行预处理;提取短文本特征词;将短文本特征词转换为短文本特征向量;先初始化聚类中心,然后将聚类中心映射到LSH表中;再根据短文本到聚类中心的文本相似度,选择若干个候选类;根据哈希值选择短文本特征向量的簇集合;重新计算短文本特征向量的簇集合的新聚类中心;循环执行直到新聚类中心不再发生变化,输出文本聚类结果。本发明中,采用WMD‑IP距离作为文本相似度,考虑词向量的位置,这样便可更充分的利用词语的语义信息,减少中间计算过程的复杂度,提高短文本框聚类结果的精度。
-
公开(公告)号:CN110704694A
公开(公告)日:2020-01-17
申请号:CN201910936020.2
申请日:2019-09-29
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F16/901 , G06F16/906 , G06K9/62
Abstract: 本发明公开了一种基于网络表示学习的组织层级划分方法及其应用,该方法包括以下步骤:基于层次拓扑结构特征的网络节点表示学习方法,获得节点向量表示;将得到的节点向量表示作为聚类算法的输入,通过节点相似性聚类算法得到节点的层级划分结果。本发明实现节点表示的位置无关性,使得节点的表示更加准确,组织层级划分结果也会更加准确。
-
公开(公告)号:CN110609857A
公开(公告)日:2019-12-24
申请号:CN201910811085.4
申请日:2019-08-30
Applicant: 哈尔滨工业大学(威海) , 威海天之卫网络空间安全科技有限公司
IPC: G06F16/2458 , G06Q40/04
Abstract: 本发明属于数据处理技术领域,涉及一种序列模式的挖掘方法。该方法包括:利用时间窗口对原始序列进行划分,形成时间序列集;扫描时间序列集,获取一项式集合;根据频繁一项式定义采用动态阈值对一项式进行筛选,将非频繁的项从序列集中删除,得到频繁一项式集;从频繁一项式集中的第一项开始以所述的第一项为前缀构造后缀,对后缀进行频繁多项式的挖掘,满足频繁多项式定义的项为频繁项,当后缀为空时,挖掘结束;遍历频繁一项式集合,迭代进行上一步操作,直到频繁一项式集合被遍历完成,得到频繁项集合。本发明的方法,在识别频繁一项式时,采用了动态变化的支持度阈值;不仅对不同序列之间频繁出现的模式进行挖掘,也挖掘一个序列内部频繁出现的模式。
-
公开(公告)号:CN110363586A
公开(公告)日:2019-10-22
申请号:CN201910594639.X
申请日:2019-07-03
Applicant: 哈尔滨工业大学(威海) , 哈工大(威海)创新创业园有限责任公司
IPC: G06Q30/02 , G06F16/951 , G06F16/34 , G06F16/36
Abstract: 本发明公开了一种面向情报分析的人机交互系统及其数据处理方法,所述系统包括人机交互界面、数据输入模块、数据获取模块、数据处理模块、数据分析模块、结果展示模块,所述数据输入模块用于为用户提供输入接口;所述数据获取模块采用信息爬取方式获取情报信息,数据获取方式包括但不限于通用搜索、新闻搜索、社交搜索、论坛搜索、本地搜索、暗网搜索、学者搜索、企业搜索;所述数据处理模块用于对获取的情报信息进行数据处理,提高情报信息的质量,并保存处理结果;所述数据分析模块用于深入挖掘情报,并将挖掘结果交给结果展示模块进行可视化展示。本发明实现数据处理可视化,提高情报分析的准确性。
-
公开(公告)号:CN110362678A
公开(公告)日:2019-10-22
申请号:CN201910481863.8
申请日:2019-06-04
Applicant: 哈尔滨工业大学(威海) , 哈工大(威海)创新创业园有限责任公司
Abstract: 本发明公开了一种自动提取中文文本关键词的方法与装置,该方法包括:首先对文本进行中文分词和去除停用词;然后将单词转化为词向量,然后统计词频,通过词频和词语相似度计算单词在文本中的权重;然后构建基于图模型的文本排序算法,多次迭代计算出顶点得分;并且每次迭代计算过程中对关键词合并,并在图模型中添加新顶点并计算得分,然后对顶点得分进行排序,得分最大的为文本中最重要的关键词,本发明可实现中文文本关键词的准确提取。
-
公开(公告)号:CN104166725B
公开(公告)日:2018-01-12
申请号:CN201410422615.3
申请日:2014-08-26
Applicant: 哈尔滨工业大学(威海)
IPC: G06F17/30
Abstract: 本发明实施例公开一种钓鱼网站检测方法,应用于计算机网络领域,以解决现有的检测钓鱼网站不能主动检测、误报、漏报、不及时的问题。该方法包括:建立待测网页对应的基于视觉内容的特征向量;将特征向量与预设的特征向量集合里的特征向量进行比对;根据比对结果判断待测网页是否是钓鱼网站。本发明实施例适用于钓鱼网站检测。
-
公开(公告)号:CN104113539A
公开(公告)日:2014-10-22
申请号:CN201410332426.7
申请日:2014-07-11
Applicant: 哈尔滨工业大学(威海)
IPC: H04L29/06
Abstract: 本发明实施例公开一种钓鱼网站引擎探测方法及装置,应用于通信领域,能够解决现有的探测钓鱼网站引擎不及时只能对钓鱼网站被动防御的问题。该方法包括:对保护列表信息进行域名变换,获得变换后的域名;将变换后的域名进行DNS解析,以获得可疑域名;将可疑域名进行URL检测,以获得可疑URL信息;根据可疑URL信息探测钓鱼网站引擎。本发明的实施例应用于探测钓鱼网站。
-
公开(公告)号:CN119399732A
公开(公告)日:2025-02-07
申请号:CN202411501638.3
申请日:2024-10-25
Applicant: 哈尔滨工业大学(威海)
IPC: G06V20/58 , G06V20/70 , G06V10/25 , G06V10/26 , G06V10/764 , G06V10/80 , G06V10/82 , G06N3/045 , G06N3/0464 , G06N3/084
Abstract: 本申请是基于深度学习的非结构化道路可行驶区域识别方法和程序,将道路图像输入可行驶区域识别模型进行图像识别,得到道路识别结果。可行驶区域识别模型的主干网络设置有C2f‑iRMB模块,颈部网络设置有特征融合模块,分割检测头部融合集成了SeaFormer模块。相比较于原YOLOv8n‑seg模型,本申请的可行驶区域识别模型通过C2f‑iRMB模块将特征图像中的位置信息整合到通道注意力中,通过颈部网络对道路图像进行语义分割,通过分割检测头部进行目标检测和目标图像分割。本申请的可行驶区域识别模型的准确率、召回率、mAP、FPS以及FLOPS都有较大提升,适用于非结构化道路的可行驶区域识别和分割。
-
公开(公告)号:CN114756596B
公开(公告)日:2024-11-05
申请号:CN202210240866.4
申请日:2022-03-10
Applicant: 哈尔滨工业大学(威海)
IPC: G06F16/2458 , G06F16/29 , G06Q10/047 , G06Q50/40
Abstract: 本发明涉及公交查询技术领域,且公开了公交查询系统,包括管理模块、该管理模块与查询系统电性连接,该管理模块外侧具有查询模块,该查询模块与该查询系统电性连接,该管理模块用于储存公交线路,该查询模块包括模糊查询站点、查询换乘最少、查询站数最少以及显示路线地图,该模糊查询站点、查询换乘最少、查询站数最少以及显示路线地图均与该查询模块电性连接,在一种可能的实施方式中,模糊查询站点:用户通过给出关键字来识别是否含有相关站点,以方便用户后续通过输入期望到达的起始站和终点站来搜索到符合自己期望的路线,解决现有技术中算法不够先进,查询方式多采用分类讨论的方式进行查询等问题。
-
-
-
-
-
-
-
-
-