基于Bert-LSTM的文本多特征分类方法及装置

    公开(公告)号:CN114547303B

    公开(公告)日:2024-10-29

    申请号:CN202210165299.0

    申请日:2022-02-18

    摘要: 本发明公开了一种基于Bert‑LSTM的文本多特征分类方法及装置,属于文本分类技术领域,其中,该方法包括:确定待分类文本数据集,并划分为训练集和测试集;构建基于Bert‑LSTM的文本多特征分类模型;利用训练集对文本多特征分类模型进行训练,得到最优文本多特征分类模型;将待分类文本数据输入最优文本多特征分类模型中,计算待分类文本数据的得分,根据得分将其划分到预设对应类别中。该方法使用BERT以及双向长短期记忆网络等构建基于Bert‑LSTM的文本多特征分类模型,利用挖掘文本多方面的词特征信息和词义潜在语义表示特征信息,融入文本向量,模型在训练过程中充分利用多特征信息,提升了文本分类的性能。

    一种时空联合的交通流量预测方法及装置

    公开(公告)号:CN114529081B

    公开(公告)日:2024-06-11

    申请号:CN202210150863.1

    申请日:2022-02-18

    摘要: 本发明公开了一种时空联合的交通流量预测方法及装置,属于交通流量预测技术领域,其中,该方法包括:获取各个监测点的监测数据,将数据按照时间周期性规律进行分类并建立数据集,根据数据集构建监测站点无向图,同时将数据集划分训练集、测试集和验证集;基于监测站点无向图,构建时空联合的交通流量预测模型;利用训练集对时空联合的交通流量预测模型进行训练,得到最优时空联合的交通流量预测模型;将验证集输入到最优时空联合的交通流量预测模型中,计算未来交通流量预测值。该方法通过对时空注意力进行解耦,将数据进行更加细粒性的特征划分,充分考虑到每个监测点和每个时刻的特征,更高效的提取数据中的空间相关性和时间。

    一种基于船舶数值虚拟试验的报告自动生成方法

    公开(公告)号:CN110991156B

    公开(公告)日:2023-05-23

    申请号:CN201911142359.1

    申请日:2019-11-20

    IPC分类号: G06F40/186 G06F8/30

    摘要: 本发明是一种基于船舶数值虚拟试验的报告自动生成方法。本发明本发明主要包括:框架设计、数据处理、后处理、数据替换和框架集成。本发明提出的基于船舶数值虚拟试验的报告自动生成方法,可以将在网页进行虚拟试验时所生成的json文件或相关的数据文件通过智能抽取,自动将其转换成对应的图像、表格、文本,并生成试验报告。这种试验报告自动生成的方法不但可以准确的表达数据之间的关系,还可以展现出各种试验结果。使试验结果具有更好的通用性和一致性,并且提高了生成试验报告的效率。

    一种基于会话内异构行为的点击率预测方法

    公开(公告)号:CN114529077A

    公开(公告)日:2022-05-24

    申请号:CN202210137611.5

    申请日:2022-02-15

    摘要: 本发明提出了一种基于会话内异构行为的点击率预测方法,获得用户信息数据集、项目信息数据集和用户行为序列数据集,分别对三种数据集进行预处理,并分为训练集和测试集;构建基于会话内异构行为的点击率预测模型;训练构建的基于会话内异构行为的点击率预测模型;将待推荐用户的个人信息、待推荐项目信息和待推荐用户行为序列输入到训练后的基于会话内异构行为的点击率预测模型,计算用户对目标项目的点击率,根据点击率将项目进行排序,并将排序后的项目列表推荐给用户;本发明同时考虑了用户与项目之间的多种异构行为对用户兴趣的影响,利用注意力机制计算不同类型的行为对兴趣的影响权重,更加精准地提取用户的兴趣。

    一种面向多敏感属性数据发布的匿名隐私保护方法

    公开(公告)号:CN110659513A

    公开(公告)日:2020-01-07

    申请号:CN201910933708.5

    申请日:2019-09-29

    IPC分类号: G06F21/62

    摘要: 本发明公开了一种面向多敏感属性数据发布的匿名隐私保护方法。步骤1:计算原始数据表中各属性间的相关性,定义属性类别;步骤2:根据属性间的相关性,将所有属性进行分组;步骤3:将每个分组按照属性间相关性大小,由高到低排序;步骤4:计算每组内,敏感属性值出现频率,判断属性值是否需要保护;步骤5:将需要保护的敏感属性值及其关联属性与无需保护的敏感属性值进行交换;步骤6:对相关属性进行频繁项集挖掘;步骤7:使用聚类技术生成匿名等价组,匿名等价组内每个敏感属性满足L多样性。本发明通过降低匿名率,关联属性共同置换,在保证隐私保护强度的同时,提高数据的可用性。

    一种时空相关的空气质量预测方法

    公开(公告)号:CN110598953A

    公开(公告)日:2019-12-20

    申请号:CN201910900378.X

    申请日:2019-09-23

    摘要: 本发明是一种时空相关的空气质量预测方法。本发明将城市划分成大小相同的网格,每个网格受相邻区域网格影响,按照网格内是否有空气监测站分为预测区域和估计区域;获取影响空气质量数据相关时序数据,对时序数据采用循环神经网络和空间深度学习进行特征提取,进行时序模型训练。获取影响空气质量数据相关非时序数据,对非时序数据采用卷积神经网络进行特征提取,进行空间模型训练;将时序模型训练和空间训练模型进行协同训练,得到预测模型;利用训练好的协同训练模型进行预测区域的训练,得到预测区域空气质量数据;利用训练好的协同训练模型进行估计网格区域的训练,得到估计区域空气质量数据。