-
公开(公告)号:CN108846029A
公开(公告)日:2018-11-20
申请号:CN201810519637.X
申请日:2018-05-28
Applicant: 哈尔滨工程大学
Abstract: 本发明公开了一种基于知识图谱的情报关联分析方法,属于RDF知识图谱条件下情报相关性检索领域。本发明包括:数据的预处理过程,对下载的情报数据TXT文档进行解析;构建三元组情报知识库;利用IDF和信息熵加权方法,计算每一个三元组和其关键词的权重,并存储到数据库中;通过三元组相似度计算公式来计算每个三元组的相似三元组,并根据相似度进行排序;对RDF三元组进行有效存储;采用Jena TDB提供的API实现基本的SPARQL查询操作,并根据基于三元组相似度的查询方法进行查询扩展;生成查询样例,对检索结果集中根据三元组和关键词的权重进行有效排序,返回top-k结果。
-
公开(公告)号:CN111460147B
公开(公告)日:2023-06-23
申请号:CN202010214338.2
申请日:2020-03-24
Applicant: 哈尔滨工程大学
IPC: G06F16/35 , G06F16/33 , G06F40/216 , G06F40/126
Abstract: 一种基于语义增强的标题短文本分类方法,它属于文本分类技术领域。本发明解决了现有方法对情报数据挖掘中的标题短文本分类的精确度低的问题。本发明对采集的标题短文本以及标题短文本对应的文章内容进行预处理后,将预处理后的文章内容作为样本数据的扩充语料,另外还通过特征检索的方式获得了标题短文本的扩充语料,并且利用验证集对模型参数寻优时获得的优质数据集对训练集进行更新,即本发明对标题短文本进行了CSE编码语义增强和ASE自主语义增强,通过语义增强技术对标题短文本进行分类,可以有效提高FastText分类器在短文本分类上的精确度,分类精度将有近30%的大幅度提升。本发明可以应用于短文本分类。
-
公开(公告)号:CN111476321B
公开(公告)日:2022-05-17
申请号:CN202010420676.1
申请日:2020-05-18
Applicant: 哈尔滨工程大学
Abstract: 基于特征加权贝叶斯优化算法的空中飞行物识别方法涉及一种空中飞行物识别方法。本发明是为了解决现有的空中飞行物的识别方法存在的准确率较低的问题。本发明通过对空中飞行物的特征数据分布情况进行分析,将特征重叠部分的分布情况中分布跨度和分布密度作为特征的权值计算依据,将其作为朴素贝叶斯识别模型的输入特征的权重,进而基于特征加权贝叶斯优化算法的结果实现空中飞行物的识别。主要用途飞行物的识别。
-
公开(公告)号:CN110147393B
公开(公告)日:2021-08-13
申请号:CN201910435269.5
申请日:2019-05-23
Applicant: 哈尔滨工程大学
IPC: G06F16/2458
Abstract: 面向数据空间的实体解析方法,本发明涉及实体解析方法。本发明的目的是为了解决现有在数据空间中进行实体解析时,要对记录进行对比,对于不同领域的记录对,匹配概率很小,成对对比会浪费资源的问题。过程为:步骤一、构建记录图:步骤二、采用剪枝方法简化记录图;步骤三、对剪化后的记录图进行分块处理;步骤四、建立属性映射集群;步骤五、计算属性映射集的优度;步骤六、得到属性映射集群中各个映射集的优度后,在块内进行实体解析。本发明用于数据实体解析领域。
-
公开(公告)号:CN109284662A
公开(公告)日:2019-01-29
申请号:CN201810766508.0
申请日:2018-07-12
Applicant: 哈尔滨工程大学
Abstract: 本发明公开了一种面向水下声音信号分类的迁移学习方法,涉及机器学习技术领域;本发明将数据集之间的分布和领域之间的域不变性结合;在类别分类器部分,使用MMD算法去匹配两数据集间的分布差异,并通过对内核的数量以及覆盖范围进行改变,最小化两数据集之间的分布差异;而在域分类器部分,则利用梯度反转去阻止域分类器在误差反向传播阶段的梯度下降,最大化域分类器的分类误差,使分类器具有领域不变性。一种面向水下声音信号分类的迁移学习方法,以动态的调整两种方法在模型进行迭代训练过程中的重要程度。通过实验证明,本发明提出的迁移学习方法要优于传统的分类方法以及现有的迁移学习方法DAN和DSN,并且分类越复杂,效果越明显。
-
公开(公告)号:CN109189862A
公开(公告)日:2019-01-11
申请号:CN201810766488.7
申请日:2018-07-12
Applicant: 哈尔滨工程大学
Abstract: 本发明公开了一种面向科技情报分析的知识库构建方法,属于计算机知识库构建领域。提出了CWATT-BiLSTM-LSTMd模型用于实体抽取、RL-TreeLSTM模型用于实体关系抽取。实体抽取采用编码-解码模式,BiLSTM(双向长短期记忆网络)用于编码,LSTMd(长短期记忆网络)用于解码,并且对嵌入层和解码层进行了改进,然后使用此模型对科技情报领域的语料进行实体抽取。在实体抽取的基础之上,基于强化深度学习的思想提出RL-TreeLSTM模型对实体之间的关系进行抽取。RL-TreeLSTM模型分为两个部分:选择器和分类器。选择器选择有效的句子传入分类器,以降低远程监督方法带来的噪音;分类器对有效句子进行实体关系抽取,提高关系抽取的准确率。
-
-
-
-
-