一种融合节点属性和图结构的半监督社区发现方法

    公开(公告)号:CN110442800A

    公开(公告)日:2019-11-12

    申请号:CN201910659962.0

    申请日:2019-07-22

    Abstract: 一种融合节点属性和图结构的半监督社区发现方法,属于网络分析技术领域。包括以下步骤:1)计算m个属性的信息熵;2)计算属性相似度;3)利用Jaccard相似度计算结构相似度;4)计算属性和结构总的相似度;5)寻找K个初始社区;6)初始化初始社区矩阵;7)结合半监督方法计算出社区划分矩阵;8)计算平衡值(trade-off)分析参数的合理取值范围9)根据trade-off和模块度获得最优的模块度及社区发现结果。本发明通过不断调节算法中涉及的参数来得到一种合理地划分方式,并最后给出对于社区发现最优结果以及算法参数合理范围;融合属性进行社区发现,给出了属性所占比例的合理范围,社区发现模块度和紧密度得到提高。

    基于深度对抗域自适应的多源开集图像分类方法、电子设备及计算机存储介质

    公开(公告)号:CN117274695A

    公开(公告)日:2023-12-22

    申请号:CN202311233678.X

    申请日:2023-09-22

    Abstract: 基于深度对抗域自适应的多源开集图像分类方法、电子设备及计算机存储介质,涉及迁移学习领域,解决现有多源开放集迁移学习方法将目标域中的未知类视为一个大类别,忽略了类别的多样性,易造成未知类的混淆的问题。本发明提供以下技术方案:多源开集图像分类方法包括以下步骤:将公开数据集作为试验数据集,对目标数据集按字母顺序分为已知类和未知类,对目标域数据集进行预处理;预处理后的目标数据集引入对比正则项,获得源域数据集的域不变特征;为目标域数据集中未知类样本构造决策边界;预测属于目标域数据集中的未知类样本的概率;采用改进的无监督聚类算法迭代地为得到的未知类样本进行聚类。还适用多源开放集图像分类方法领域。

    基于自编码器和数据增强的高维稀疏数据离群点检测方法及系统

    公开(公告)号:CN116595465A

    公开(公告)日:2023-08-15

    申请号:CN202310378368.0

    申请日:2023-04-10

    Abstract: 本发明公开了一种基于自编码器和数据增强的高维稀疏数据离群点检测方法及系统,属于数据挖掘技术领域,其中,该方法包括:获取异常检测样本数据集作为试验数据集,并对其进行预处理,得到训练集和测试集;构建数据增强模型,以对训练集进行上下采集处理,得到类异常样本与正常样本相等的增强数据;将训练集输入注意力机制模块中,以计算特征关联度;将增强数据输入注意力机制模型中,根据特征关联度计算相关特征数,根据相关特征数计算重构数据;利用离群点检测基准器对重构数据进行异常检测。该方法基于自编码器对数据进行降维操作,将稀疏的高维数据映射到低维空间中进行离群点检测,解决了维度过高对检测结果准确率的影响。

    一种面向多敏感属性数据发布的匿名隐私保护方法

    公开(公告)号:CN110659513B

    公开(公告)日:2022-12-06

    申请号:CN201910933708.5

    申请日:2019-09-29

    Abstract: 本发明公开了一种面向多敏感属性数据发布的匿名隐私保护方法。步骤1:计算原始数据表中各属性间的相关性,定义属性类别;步骤2:根据属性间的相关性,将所有属性进行分组;步骤3:将每个分组按照属性间相关性大小,由高到低排序;步骤4:计算每组内,敏感属性值出现频率,判断属性值是否需要保护;步骤5:将需要保护的敏感属性值及其关联属性与无需保护的敏感属性值进行交换;步骤6:对相关属性进行频繁项集挖掘;步骤7:使用聚类技术生成匿名等价组,匿名等价组内每个敏感属性满足L多样性。本发明通过降低匿名率,关联属性共同置换,在保证隐私保护强度的同时,提高数据的可用性。

    一种融合多粒度信息的中文命名实体识别方法、设备和介质

    公开(公告)号:CN114781380A

    公开(公告)日:2022-07-22

    申请号:CN202210277553.6

    申请日:2022-03-21

    Abstract: 本发明提出一种融合多粒度信息的中文命名实体识别方法、设备和介质。所述方法步骤如下:(1)获取领域语料数据集,将数据集进行预处理并分为训练集、测试集、验证集;(2)提取(1)预处理后的语料数据中字符、软词、部首级预训练向量并进行融合;(3)构建融合多粒度信息的中文命名实体识别模型;(4)将(2)所得的数据输入到模型中进行训练;(5)利用(4)所得的识别模型对待识别数据进行处理与计算,得到命名实体识别结果。本发明针对中文命名实体识别存在的不足,通过融合部首级信息利用序列中字符内部固有的语义信息,利用扩展的软词模块获取了词级别的语义信息,将两者融入到字符嵌入向量中,提高了中文命名实体识别的精度。

    基于Bert-LSTM的文本多特征分类方法及装置

    公开(公告)号:CN114547303A

    公开(公告)日:2022-05-27

    申请号:CN202210165299.0

    申请日:2022-02-18

    Abstract: 本发明公开了一种基于Bert‑LSTM的文本多特征分类方法及装置,属于文本分类技术领域,其中,该方法包括:确定待分类文本数据集,并划分为训练集和测试集;构建基于Bert‑LSTM的文本多特征分类模型;利用训练集对文本多特征分类模型进行训练,得到最优文本多特征分类模型;将待分类文本数据输入最优文本多特征分类模型中,计算待分类文本数据的得分,根据得分将其划分到预设对应类别中。该方法使用BERT以及双向长短期记忆网络等构建基于Bert‑LSTM的文本多特征分类模型,利用挖掘文本多方面的词特征信息和词义潜在语义表示特征信息,融入文本向量,模型在训练过程中充分利用多特征信息,提升了文本分类的性能。

    一种时空联合的交通流量预测方法及装置

    公开(公告)号:CN114529081A

    公开(公告)日:2022-05-24

    申请号:CN202210150863.1

    申请日:2022-02-18

    Abstract: 本发明公开了一种时空联合的交通流量预测方法及装置,属于交通流量预测技术领域,其中,该方法包括:获取各个监测点的监测数据,将数据按照时间周期性规律进行分类并建立数据集,根据数据集构建监测站点无向图,同时将数据集划分训练集、测试集和验证集;基于监测站点无向图,构建时空联合的交通流量预测模型;利用训练集对时空联合的交通流量预测模型进行训练,得到最优时空联合的交通流量预测模型;将验证集输入到最优时空联合的交通流量预测模型中,计算未来交通流量预测值。该方法通过对时空注意力进行解耦,将数据进行更加细粒性的特征划分,充分考虑到每个监测点和每个时刻的特征,更高效的提取数据中的空间相关性和时间。

    一种基于用户多意图演进的序列推荐方法

    公开(公告)号:CN114491248A

    公开(公告)日:2022-05-13

    申请号:CN202210067403.2

    申请日:2022-01-20

    Abstract: 本发明提出了一种基于用户多意图演进的序列推荐方法,所述方法具体包括:采集用户的历史交互数据,并对数据进行预处理;设计多意图提取模块,捕获用户的多个意图;设计意图感知重映射层,将序列的顺序信息和时间信息显示地注入到用户项目的交互序列中;设计意图感知演进层,捕捉用户每个兴趣意图的动态偏移;设计多意图聚合模块,在更精细的意图粒度上捕获具有更多信息的用户表示。本发明可以同时考虑用户历史交互序列中的潜在多意图、不同意图的动态演变以及丰富候选物品的特征表示最大化的利用多意图嵌入的好处,从而达到提升推荐性能的目的。

    一种基于船舶数值虚拟试验的报告自动生成方法

    公开(公告)号:CN110991156A

    公开(公告)日:2020-04-10

    申请号:CN201911142359.1

    申请日:2019-11-20

    Abstract: 本发明是一种基于船舶数值虚拟试验的报告自动生成方法。本发明本发明主要包括:框架设计、数据处理、后处理、数据替换和框架集成。本发明提出的基于船舶数值虚拟试验的报告自动生成方法,可以将在网页进行虚拟试验时所生成的json文件或相关的数据文件通过智能抽取,自动将其转换成对应的图像、表格、文本,并生成试验报告。这种试验报告自动生成的方法不但可以准确的表达数据之间的关系,还可以展现出各种试验结果。使试验结果具有更好的通用性和一致性,并且提高了生成试验报告的效率。

Patent Agency Ranking