一种基于LSTM自编码器的耕地闲置识别方法

    公开(公告)号:CN118628925A

    公开(公告)日:2024-09-10

    申请号:CN202410705819.1

    申请日:2024-06-03

    摘要: 本发明公开了一种基于LSTM自编码器的耕地闲置识别方法,包括采集预设区域的时序数据,对所述时序数据进行预处理,对所述时序多光谱遥感图像进行逐月聚合并取中值获得时间段聚合时序HLS影像,对所述时序遥感影像进行逐月聚合并取低值获得时间段聚合时序SAR影像,根据所述时间段聚合时序HLS影像所述耕地特征,将土地覆被分成三种模式,根据所述三种模式分别构建LSTM自编码器模型,优化所述LSTM自编码器模型,将闲置耕地的所述植被指数输入LSTM自编码器模型确定残差分布阈值,将待识别数据输入LSTM自编码器模型,输出识别结果。该方法不仅可以提高基于LSTM自编码器的耕地闲置识别的精度,同时具有较好的可解释性,可以直接应用于耕地闲置识别系统中。

    一种多变量时间序列数据聚类方法

    公开(公告)号:CN111488924B

    公开(公告)日:2024-04-26

    申请号:CN202010265442.4

    申请日:2020-04-07

    发明人: 王婷 崔运鹏 刘娟

    摘要: 本发明公开了一种多变量时间序列数据聚类方法,包括对多变量时间序列数据进行归一化预处理;构建深度学习无监督学习模型稀疏自编码器,对多变量时间序列数据进行特征提取以构建新特征序列;获取样本数据新特征序列的聚类K值;基于欧式距离计算不同样本数据新特征序列之间的距离;对样本数据的新特征序列集进行聚类;根据聚类结果分析多变量时间序列数据的潜在模式。本发明通过稀疏自编码器模型和聚类方法,提高处理大规模数据的效率,并构建稀疏自编码器模型以提高模型对多变量时间序列数据提取新特征序列的性能,同时根据欧式距离构建了多变量距离计算模型以实现对多变量时间序列数据的聚类。

    基于时序遥感数据的弱监督LSTM循环神经网络稻田识别方法

    公开(公告)号:CN112836725A

    公开(公告)日:2021-05-25

    申请号:CN202110032036.8

    申请日:2021-01-11

    摘要: 本发明公开了一种基于时序多光谱及微波遥感数据的弱监督LSTM循环神经网络稻田识别方,发明基于地面实测数据构建SAR标准时序曲线,并对SAR时序遥感数据进行DTW距离计算,依据DTW距离进行样本标注,构建高置信度的弱标签样本集,融合多光谱及SAR输入特征,基于LSTM的深度学习分类器采用弱标签样本加实测样本的训练集对分类器进行训练后提取预测结果中的水稻分类作为最终稻田识别结果。该方法可以用于像素级别的稻田识别预测,通过SAR曲线的DTW距离可标注获得高置信度的训练数据,减少对地面采样数据的依赖,可有效降低地面采样成本。

    一种生物信息深度挖掘分析系统的架构构建方法

    公开(公告)号:CN112151114A

    公开(公告)日:2020-12-29

    申请号:CN202011124509.9

    申请日:2020-10-20

    IPC分类号: G16B20/20 G16B10/00 G06N20/00

    摘要: 本发明公开了一种生物信息深度挖掘分析系统的架构构建方法,包括如下步骤:S1:构建高通量计算一体化集群网络环境;S2:集成生物信息工具,形成生物信息挖掘分析方法调用库和生物信息挖掘分析流程模板;S3:基于PiFlow框架构建面向生物信息深度挖掘分析的图形化工作流模型;S4:基于Spark Streaming构建生物信息挖掘分析任务的调度和处理模型本发明具有提高多个挖掘分析工具之间的数据交换性能,降低挖掘分析过程的复杂程度,减少挖掘分析任务尤其是多个任务并发场景下的执行时间等优点。

    一种云环境下科学工作流数据放置方法

    公开(公告)号:CN110058812A

    公开(公告)日:2019-07-26

    申请号:CN201910174765.X

    申请日:2019-03-08

    IPC分类号: G06F3/06 G06K9/62

    摘要: 本发明设计了一种云环境下科学工作流数据放置方法,针对科学工作流数据密集及数据规模大的特征,首先根据工作流的数据和任务之间的关系,对数据进行预划分;然后把预划分的数据作为聚类的初始状态,结合数据规模及数据-任务相关性特征,进行数据的聚类;最后结合数据中心可用存储容量的情况进行数据放置的决策和实施。实验证明本发明方法可以有效减少数据中心间的数据传输开销,提高数据放置的效率。

    一种多变量时间序列数据聚类方法

    公开(公告)号:CN111488924A

    公开(公告)日:2020-08-04

    申请号:CN202010265442.4

    申请日:2020-04-07

    发明人: 王婷 崔运鹏 刘娟

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本发明公开了一种多变量时间序列数据聚类方法,包括对多变量时间序列数据进行归一化预处理;构建深度学习无监督学习模型稀疏自编码器,对多变量时间序列数据进行特征提取以构建新特征序列;获取样本数据新特征序列的聚类K值;基于欧式距离计算不同样本数据新特征序列之间的距离;对样本数据的新特征序列集进行聚类;根据聚类结果分析多变量时间序列数据的潜在模式。本发明通过稀疏自编码器模型和聚类方法,提高处理大规模数据的效率,并构建稀疏自编码器模型以提高模型对多变量时间序列数据提取新特征序列的性能,同时根据欧式距离构建了多变量距离计算模型以实现对多变量时间序列数据的聚类。

    一种基于分组的文档内容差异对比可视化分析方法

    公开(公告)号:CN110852059A

    公开(公告)日:2020-02-28

    申请号:CN201911111334.5

    申请日:2019-11-14

    IPC分类号: G06F40/194

    摘要: 本发明公开了一种基于分组的文档内容差异对比可视化分析方法,包括对所述目标数据集进行文本清洗和降噪处理后得到核心数据集;在所述核心数据集上创建分组,将所述核心数据集按类别分组,并任意确定两个待分析的目标分组;针对所述目标分组构建分组语料库,将每个特征词看作以领域特征得分为横坐标、类别关联归一化F值为纵坐标的数据点,在二维坐标系下可视化展现分组文档特征词关联分布散点图。本发明能够帮助用户清晰洞察分组文档主题内容的语义对比差异,同时为用户提供一种交互式查询特征词所在文档的窗口,便于跟踪特征词在文档中分布的分组对比情况。

    一种基于大数据的品牌数据智能识别诊断方法及系统

    公开(公告)号:CN118427779A

    公开(公告)日:2024-08-02

    申请号:CN202410510161.9

    申请日:2024-04-26

    摘要: 本发明公开了一种基于大数据的品牌数据智能识别诊断方法及系统,包括获取品牌数据和品牌历史数据,对所述品牌数据进行预处理;对所述品牌数据进行多种类别的特征提取获得特征数据,对所述特征数据进行聚类分析获取诊断数据,对所述特征数据进行相关性分析获取评估数据;构建计算模型,根据所述品牌历史数据训练并测试模型,将所述诊断数据输入所述计算模型获得诊断结果,将所述评估数据输入所述计算模型获得评估结果;将所述诊断结果和所述评估结果结合分析,获得分析结果并输出。该方法不仅可以提高基于大数据的品牌数据智能识别诊断方法的精度,同时具有较好的可解释性,可以直接应用于大数据的品牌数据智能识别诊断系统中。