-
公开(公告)号:CN114519145A
公开(公告)日:2022-05-20
申请号:CN202210160090.5
申请日:2022-02-22
Applicant: 哈尔滨工程大学
IPC: G06F16/9535 , G06N3/04 , G06N3/08 , G06Q30/06
Abstract: 本发明提出了一种基于图神经网络挖掘用户长短期兴趣的序列推荐方法,获得用户个人信息和用户交互序列数据集,将数据集进行预处理并分为训练集和测试集;构建基于图神经网络挖掘用户长短期兴趣的序列推荐模型;对所述基于图神经网络挖掘用户长短期兴趣的序列推荐模型进行训练;将待推荐用户的个人信息和交互序列输入到训练后的基于图神经网络挖掘用户长短期兴趣的序列推荐模型,计算待推荐项目相对于该用户的推荐得分,根据推荐得分将项目推荐给用户;本发明解决序列推荐场景中没有办法有效捕获用户长短期兴趣,并难以分辨噪声的问题。
-
公开(公告)号:CN110909057A
公开(公告)日:2020-03-24
申请号:CN201911154837.0
申请日:2019-11-22
Applicant: 哈尔滨工程大学
Abstract: 本发明公开了一种数值水池虚拟试验数据中间件的设计方法。数值水池虚拟试验应用系统(200)通过API模块(112)和通信模块(113)与主中间件(120)的通信模块(122)双向传输信号,通信模块(122)通过任务处理模块(124)与数值水池虚拟试验底层分布式NoSQL数据库(300)双向传输信号。由于数值水池虚拟试验的数据包括数值型数据、字符串、数组和图像等各种异构数据,而且属于大规模数据,用户对数据的安全和并发任务处理要求比较高;因此需要在底层配置分布式NoSQL数据库集群模式,满足对多用户、多任务的高并发需求。
-
公开(公告)号:CN110659513A
公开(公告)日:2020-01-07
申请号:CN201910933708.5
申请日:2019-09-29
Applicant: 哈尔滨工程大学
IPC: G06F21/62
Abstract: 本发明公开了一种面向多敏感属性数据发布的匿名隐私保护方法。步骤1:计算原始数据表中各属性间的相关性,定义属性类别;步骤2:根据属性间的相关性,将所有属性进行分组;步骤3:将每个分组按照属性间相关性大小,由高到低排序;步骤4:计算每组内,敏感属性值出现频率,判断属性值是否需要保护;步骤5:将需要保护的敏感属性值及其关联属性与无需保护的敏感属性值进行交换;步骤6:对相关属性进行频繁项集挖掘;步骤7:使用聚类技术生成匿名等价组,匿名等价组内每个敏感属性满足L多样性。本发明通过降低匿名率,关联属性共同置换,在保证隐私保护强度的同时,提高数据的可用性。
-
公开(公告)号:CN110659513B
公开(公告)日:2022-12-06
申请号:CN201910933708.5
申请日:2019-09-29
Applicant: 哈尔滨工程大学
IPC: G06F21/62
Abstract: 本发明公开了一种面向多敏感属性数据发布的匿名隐私保护方法。步骤1:计算原始数据表中各属性间的相关性,定义属性类别;步骤2:根据属性间的相关性,将所有属性进行分组;步骤3:将每个分组按照属性间相关性大小,由高到低排序;步骤4:计算每组内,敏感属性值出现频率,判断属性值是否需要保护;步骤5:将需要保护的敏感属性值及其关联属性与无需保护的敏感属性值进行交换;步骤6:对相关属性进行频繁项集挖掘;步骤7:使用聚类技术生成匿名等价组,匿名等价组内每个敏感属性满足L多样性。本发明通过降低匿名率,关联属性共同置换,在保证隐私保护强度的同时,提高数据的可用性。
-
公开(公告)号:CN114781380A
公开(公告)日:2022-07-22
申请号:CN202210277553.6
申请日:2022-03-21
Applicant: 哈尔滨工程大学
IPC: G06F40/295 , G06F40/289 , G06K9/62 , G06N3/04 , G06N3/08 , G06F40/30 , G06F16/36 , G06F17/18
Abstract: 本发明提出一种融合多粒度信息的中文命名实体识别方法、设备和介质。所述方法步骤如下:(1)获取领域语料数据集,将数据集进行预处理并分为训练集、测试集、验证集;(2)提取(1)预处理后的语料数据中字符、软词、部首级预训练向量并进行融合;(3)构建融合多粒度信息的中文命名实体识别模型;(4)将(2)所得的数据输入到模型中进行训练;(5)利用(4)所得的识别模型对待识别数据进行处理与计算,得到命名实体识别结果。本发明针对中文命名实体识别存在的不足,通过融合部首级信息利用序列中字符内部固有的语义信息,利用扩展的软词模块获取了词级别的语义信息,将两者融入到字符嵌入向量中,提高了中文命名实体识别的精度。
-
公开(公告)号:CN114547303A
公开(公告)日:2022-05-27
申请号:CN202210165299.0
申请日:2022-02-18
Applicant: 哈尔滨工程大学
Abstract: 本发明公开了一种基于Bert‑LSTM的文本多特征分类方法及装置,属于文本分类技术领域,其中,该方法包括:确定待分类文本数据集,并划分为训练集和测试集;构建基于Bert‑LSTM的文本多特征分类模型;利用训练集对文本多特征分类模型进行训练,得到最优文本多特征分类模型;将待分类文本数据输入最优文本多特征分类模型中,计算待分类文本数据的得分,根据得分将其划分到预设对应类别中。该方法使用BERT以及双向长短期记忆网络等构建基于Bert‑LSTM的文本多特征分类模型,利用挖掘文本多方面的词特征信息和词义潜在语义表示特征信息,融入文本向量,模型在训练过程中充分利用多特征信息,提升了文本分类的性能。
-
公开(公告)号:CN114529081A
公开(公告)日:2022-05-24
申请号:CN202210150863.1
申请日:2022-02-18
Applicant: 哈尔滨工程大学
Abstract: 本发明公开了一种时空联合的交通流量预测方法及装置,属于交通流量预测技术领域,其中,该方法包括:获取各个监测点的监测数据,将数据按照时间周期性规律进行分类并建立数据集,根据数据集构建监测站点无向图,同时将数据集划分训练集、测试集和验证集;基于监测站点无向图,构建时空联合的交通流量预测模型;利用训练集对时空联合的交通流量预测模型进行训练,得到最优时空联合的交通流量预测模型;将验证集输入到最优时空联合的交通流量预测模型中,计算未来交通流量预测值。该方法通过对时空注意力进行解耦,将数据进行更加细粒性的特征划分,充分考虑到每个监测点和每个时刻的特征,更高效的提取数据中的空间相关性和时间。
-
公开(公告)号:CN114491248A
公开(公告)日:2022-05-13
申请号:CN202210067403.2
申请日:2022-01-20
Applicant: 哈尔滨工程大学
IPC: G06F16/9535 , G06N3/04 , G06N3/08
Abstract: 本发明提出了一种基于用户多意图演进的序列推荐方法,所述方法具体包括:采集用户的历史交互数据,并对数据进行预处理;设计多意图提取模块,捕获用户的多个意图;设计意图感知重映射层,将序列的顺序信息和时间信息显示地注入到用户项目的交互序列中;设计意图感知演进层,捕捉用户每个兴趣意图的动态偏移;设计多意图聚合模块,在更精细的意图粒度上捕获具有更多信息的用户表示。本发明可以同时考虑用户历史交互序列中的潜在多意图、不同意图的动态演变以及丰富候选物品的特征表示最大化的利用多意图嵌入的好处,从而达到提升推荐性能的目的。
-
公开(公告)号:CN110991156A
公开(公告)日:2020-04-10
申请号:CN201911142359.1
申请日:2019-11-20
Applicant: 哈尔滨工程大学
IPC: G06F40/186 , G06F8/30
Abstract: 本发明是一种基于船舶数值虚拟试验的报告自动生成方法。本发明本发明主要包括:框架设计、数据处理、后处理、数据替换和框架集成。本发明提出的基于船舶数值虚拟试验的报告自动生成方法,可以将在网页进行虚拟试验时所生成的json文件或相关的数据文件通过智能抽取,自动将其转换成对应的图像、表格、文本,并生成试验报告。这种试验报告自动生成的方法不但可以准确的表达数据之间的关系,还可以展现出各种试验结果。使试验结果具有更好的通用性和一致性,并且提高了生成试验报告的效率。
-
-
-
-
-
-
-
-