-
公开(公告)号:CN104133897B
公开(公告)日:2017-07-11
申请号:CN201410374437.1
申请日:2014-08-01
Applicant: 哈尔滨工程大学
IPC: G06F17/30
Abstract: 本发明属于话题溯源范畴语义社会网络中的数据挖掘领域,具体涉及一种基于话题影响力的微博话题溯源方法。本发明包括:根据信息检索领域的隐形语义查询扩展方法,对输入的话题词组tp进行语义扩展,得到与给定话题相关的前k个话题;确定微博网络中的用户关系及信息传播规律,确定话题影响力TIN;根据影响力计算公式,以1h为一个时间步计算话题的影响力,得到话题在传播过程中随着时间变化的影响力趋势,其影响力强度从话题初期的缓慢增长到急剧上升最后达到平稳状态,即话题成长为热点;推导话题溯源递推公式,并确定其溯源递推终止条件,输出引发话题的源头。本发明使话题溯源递推的终止条件更加准确,溯源更加准确有效。
-
公开(公告)号:CN103780459B
公开(公告)日:2017-07-11
申请号:CN201410013043.3
申请日:2014-01-13
Applicant: 哈尔滨工程大学
Abstract: 本发明涉及的是一种恒定类间和类内连接密度的网络演化方法。本发明包括:(1)构造一个包含有m0个节点的全连通网络,并设置每个节点的所属于类号:(2)引入新节点,并分配新节点的所属类号:(3)建立新节点与已存在节点的连边。本发明随着网络的演化依旧能够保证网络中的类内和类间密度的恒定不变。
-
公开(公告)号:CN106547875A
公开(公告)日:2017-03-29
申请号:CN201610945406.6
申请日:2016-11-02
Applicant: 哈尔滨工程大学
Abstract: 本发明属于网络检测领域,具体涉及一种基于情感分析和标签的微博在线突发事件检测方法。本发明包括:使用情感分类模型情感轮,构造情感分析模型——情感同现图;使用步骤(1)构造的情感分析模型,对微博流中的微博进行情感分类,采用kleinberg算法检测微博流的突发期;提取突发期内的微博标签,过滤掉垃圾标签,对剩余标签进行分词处理;形成事件的初始关键词;利用步骤(3)生成的关键词,提取微博中与此关键词相关的词,形成事件的最终描述。本发明构造基于情感轮的情感同现图,情感分类更加细致,情感更容易理解和解释,相对于基于情感符号的事件检测准确率更高。
-
公开(公告)号:CN103324708A
公开(公告)日:2013-09-25
申请号:CN201310241428.0
申请日:2013-06-18
Applicant: 哈尔滨工程大学
IPC: G06F17/30
Abstract: 本发明涉及一种长文本到短文本的迁移学习方法,其特征在于:步骤1:根据目标领域短文本中提取的标签,通过搜索引擎获得源领域数据,提取源领域的种子特征集;步骤2:根据目标领域短文本的标签集和源领域的种子特征集,构建社交媒体无向图,从无向图中提取包含所有目标领域标签集和种子特征集节点的子图;步骤3:基于拉普拉斯特征映射算法,获得源领域数据新的特征表示;步骤:4:根据源领域数据新的特征表示,对源领域数据进行分类。
-
公开(公告)号:CN103176961A
公开(公告)日:2013-06-26
申请号:CN201310069560.8
申请日:2013-03-05
Applicant: 哈尔滨工程大学
IPC: G06F17/27
Abstract: 本发明的目的在于提供一种基于潜在语义分析的迁移学习方法,包括以下步骤:对训练数据做去停用词、词干化处理,分别计算源领域与目标领域词汇权重,得到词汇-文本矩阵M,对矩阵M进行奇异值分解,将M中词汇与文本映射到低维潜在语义空间,去除源领域中同义词噪音影响,调整矩阵M结构,从源领域中找出与目标领域文本关联度较大的词汇作为迁移词,再对矩阵M结构进行调整,分析调整后的矩阵M中目标领域词汇,得到目标领域数据新的特征表示,在训数据集中得到最终分类器,对测试数据集S进行分类。
-
公开(公告)号:CN102768670A
公开(公告)日:2012-11-07
申请号:CN201210176912.5
申请日:2012-05-31
Applicant: 哈尔滨工程大学
IPC: G06F17/30
Abstract: 本发明提供的是一种基于节点属性标签传播的网页聚类方法。依据网页的链接关系构造拓扑结构图模型;为图模型中每个节点构建属性特征向量;初始化网络中的节点标签;依据拓扑结构及节点属性迭代更新节点的标签;定义停止更新节点标签的条件。本发明无需了解网页分组的数量和规模等先验知识或者预先定义临界值等参数,只需提取互联网络的拓扑关系及标记网页特征的属性信息,就可以在近乎线性的时间内有效地、高质量地实现网页的聚类。由于该算法概念简单,易于理解及实现,具有较低的时间复杂度,且能够产生优质的网络聚类结果,因此适用于规模庞大的互联网络。
-
公开(公告)号:CN102158372A
公开(公告)日:2011-08-17
申请号:CN201110093278.4
申请日:2011-04-14
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种分布式系统异常检测方法。确定测度属性的关联度,并生成测度属性关系网络模型;构建测度属性关系网络划分模型;构建基于测度属性关系网络划分的分布式系统异常检测模型,并利用该模型进行异常检测。本发明可以动态的增量式更新分布式系统的测度属性关系网络的划分结果,并构建基于测度属性网络划分的分布式系统异常检测模型。
-
公开(公告)号:CN101499981A
公开(公告)日:2009-08-05
申请号:CN200910071577.0
申请日:2009-03-19
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的是一种电子邮件邮件网关类系统邮件账户维护的方法。使用POP3协议和SMTP协议探测邮件帐户信息,并将有效账户信息存储在动态散列表中,通过时间滑动窗口维护信息的有效性,这样当发现投递失败的邮件则将其从散列表中丢弃,对于新增加的用户在经过滑动窗口的等待时间以后在重新进行探测。在固定周期内,将散列结构存储到文件系统中,防止信息丢失,在系统意外重起时,可以直接从文件加载。本发明的有点在于:1)可以帮助邮件网关过滤掉大量账户不存在的邮件信息,降低了网关的负担,提高网关系统的利用率;2)支持在一个邮件网关中,同时管理多个邮件系统,减少了系统的部署成本。
-
公开(公告)号:CN109492776B
公开(公告)日:2022-05-17
申请号:CN201811393919.6
申请日:2018-11-21
Applicant: 哈尔滨工程大学
Abstract: 本发明提供一种基于主动学习的微博流行度预测方法,包括如下步骤:利用新浪微博API爬取相关微博数据集;利用K‑Means算法将未标记数据集初始化训练集L;对训练数据进行特征提取得到特征向量;根据提取的特征向量训练基于支持向量机的主动学习的改进的模型,根据训练的多分类模型从未标记的样本集中选择出既有不确定性又具有多样性和代表性的样本;将筛选出的样本称为信息向量,交给专家标记;将标记的训练数据加入到初始训练集L中,循环此过程直到模型的性能达到稳定状态为止得到微博流行度预测模型。本发明减少了冗余性问题并降低了异常值问题,减少了训练样本的标记数量,同时也使得在训练数据少的情况下也得到很好的预测效果。
-
公开(公告)号:CN108510503B
公开(公告)日:2021-05-14
申请号:CN201810222986.5
申请日:2018-03-19
Applicant: 哈尔滨工程大学
Abstract: 本发明提供的事一种基于纳什均衡理论的多纹理特征图像分割方法。主要包括:对图像的14种纹理特征值进行归一化处理;采用纳什均衡理论,不断的求取14个纹理特征值各自区域收益的最大值max(∑p∈Pσp),并且根据区域收益值进行相似区域的判断与合并;将结果输出至改进的基于纳什均衡的多纹理C‑V模型中,获得光滑的图像分割轮廓线。由于模型是充分利用全图像14种纹理信息进行计算的,所以得到的结果更加全面和准确。
-
-
-
-
-
-
-
-
-