一种基于LSTM自编码器的耕地闲置识别方法

    公开(公告)号:CN118628925A

    公开(公告)日:2024-09-10

    申请号:CN202410705819.1

    申请日:2024-06-03

    摘要: 本发明公开了一种基于LSTM自编码器的耕地闲置识别方法,包括采集预设区域的时序数据,对所述时序数据进行预处理,对所述时序多光谱遥感图像进行逐月聚合并取中值获得时间段聚合时序HLS影像,对所述时序遥感影像进行逐月聚合并取低值获得时间段聚合时序SAR影像,根据所述时间段聚合时序HLS影像所述耕地特征,将土地覆被分成三种模式,根据所述三种模式分别构建LSTM自编码器模型,优化所述LSTM自编码器模型,将闲置耕地的所述植被指数输入LSTM自编码器模型确定残差分布阈值,将待识别数据输入LSTM自编码器模型,输出识别结果。该方法不仅可以提高基于LSTM自编码器的耕地闲置识别的精度,同时具有较好的可解释性,可以直接应用于耕地闲置识别系统中。

    基于时序遥感数据的弱监督LSTM循环神经网络稻田识别方法

    公开(公告)号:CN112836725A

    公开(公告)日:2021-05-25

    申请号:CN202110032036.8

    申请日:2021-01-11

    摘要: 本发明公开了一种基于时序多光谱及微波遥感数据的弱监督LSTM循环神经网络稻田识别方,发明基于地面实测数据构建SAR标准时序曲线,并对SAR时序遥感数据进行DTW距离计算,依据DTW距离进行样本标注,构建高置信度的弱标签样本集,融合多光谱及SAR输入特征,基于LSTM的深度学习分类器采用弱标签样本加实测样本的训练集对分类器进行训练后提取预测结果中的水稻分类作为最终稻田识别结果。该方法可以用于像素级别的稻田识别预测,通过SAR曲线的DTW距离可标注获得高置信度的训练数据,减少对地面采样数据的依赖,可有效降低地面采样成本。

    一种基于词向量模型的机构名称规范方法

    公开(公告)号:CN111984776A

    公开(公告)日:2020-11-24

    申请号:CN202010844347.X

    申请日:2020-08-20

    摘要: 本发明公开了一种基于词向量模型的机构名称规范方法,包括:分析科技文献数据机构名称字段特征,选取机构相关字段;提取文献相关字段信息文本,并对相关字段进行清洗和变换;采用word2vec词向量方法对提取文本信息构建词向量模型并对机构名称进行聚类;结合词向量模型和聚类文件查找相似度高的词,从中识别并提取机构名称;采用Jaro相似度方法通过设置阈值计算匹配相似机构名称。本发明能有效改善基于海量数据的科技评价中的数据可靠性问题,规范科技文献数据库中的机构名称存储与管理,从而提升科技文献数据库建设的规范性。

    一种基于分组的文档内容差异对比可视化分析方法

    公开(公告)号:CN110852059A

    公开(公告)日:2020-02-28

    申请号:CN201911111334.5

    申请日:2019-11-14

    IPC分类号: G06F40/194

    摘要: 本发明公开了一种基于分组的文档内容差异对比可视化分析方法,包括对所述目标数据集进行文本清洗和降噪处理后得到核心数据集;在所述核心数据集上创建分组,将所述核心数据集按类别分组,并任意确定两个待分析的目标分组;针对所述目标分组构建分组语料库,将每个特征词看作以领域特征得分为横坐标、类别关联归一化F值为纵坐标的数据点,在二维坐标系下可视化展现分组文档特征词关联分布散点图。本发明能够帮助用户清晰洞察分组文档主题内容的语义对比差异,同时为用户提供一种交互式查询特征词所在文档的窗口,便于跟踪特征词在文档中分布的分组对比情况。

    一种基于分组的文档内容差异对比可视化分析方法

    公开(公告)号:CN110852059B

    公开(公告)日:2023-08-29

    申请号:CN201911111334.5

    申请日:2019-11-14

    IPC分类号: G06F40/194

    摘要: 本发明公开了一种基于分组的文档内容差异对比可视化分析方法,包括对所述目标数据集进行文本清洗和降噪处理后得到核心数据集;在所述核心数据集上创建分组,将所述核心数据集按类别分组,并任意确定两个待分析的目标分组;针对所述目标分组构建分组语料库,将每个特征词看作以领域特征得分为横坐标、类别关联归一化F值为纵坐标的数据点,在二维坐标系下可视化展现分组文档特征词关联分布散点图。本发明能够帮助用户清晰洞察分组文档主题内容的语义对比差异,同时为用户提供一种交互式查询特征词所在文档的窗口,便于跟踪特征词在文档中分布的分组对比情况。

    一种基于信令数据的移动电话用户移动路径地图匹配方法

    公开(公告)号:CN111521191A

    公开(公告)日:2020-08-11

    申请号:CN202010311822.7

    申请日:2020-04-20

    IPC分类号: G01C21/34 G01S19/42 G06K9/62

    摘要: 本发明公开了一种基于信令数据的移动电话用户移动路径地图匹配方法,通过一序列的几何识别及处理,优化路径搜索空间,减少路径识别的不确定性,同时提高计算速度。在此基础上,运行最短路径搜索算法,并通过距离函数优化匹配最优解。本发明所提供的基于信令数据的移动电话用户移动路径地图匹配方法充分考虑了用户不同的日常活动模式,使用时空聚类算法将用户移动轨迹分割为子移动轨迹,再分别进行地图匹配,通过路径匹配搜索空间限定策略,减少了路径分析计算量。本发明提供了深度搜索可选功能,通过距离损失函数进行优化,寻找最优地图匹配结果。

    一种基于词向量模型的机构名称规范方法

    公开(公告)号:CN111984776B

    公开(公告)日:2023-08-11

    申请号:CN202010844347.X

    申请日:2020-08-20

    摘要: 本发明公开了一种基于词向量模型的机构名称规范方法,包括:分析科技文献数据机构名称字段特征,选取机构相关字段;提取文献相关字段信息文本,并对相关字段进行清洗和变换;采用word2vec词向量方法对提取文本信息构建词向量模型并对机构名称进行聚类;结合词向量模型和聚类文件查找相似度高的词,从中识别并提取机构名称;采用Jaro相似度方法通过设置阈值计算匹配相似机构名称。本发明能有效改善基于海量数据的科技评价中的数据可靠性问题,规范科技文献数据库中的机构名称存储与管理,从而提升科技文献数据库建设的规范性。

    一种可扩展的网络攻击行为分类方法

    公开(公告)号:CN111507385B

    公开(公告)日:2023-04-28

    申请号:CN202010268961.6

    申请日:2020-04-08

    IPC分类号: G06F21/55 G06V10/00 G06N3/04

    摘要: 本发明公开了一种可扩展的网络攻击行为分类方法,包括对网络流量数据进行数据预处理;对网络流量数据的多维特征属性提取新特征表达和最优原特征集;通过分类模型训练获取用于网络行为攻击类别初步判定的模型相关参数;获取网络行为属于已知攻击类别和正常行为的权重值和新攻击类别的权重值综合判定网络行为攻击类别。本发明优化了对网络攻击行为的分类结果,并通过在网络流量数据多维特征属性中提取新特征表达和选择能够最大化表达数据特性的最优原特征集分别优化监督学习模型和非监督学习模型,能够在保证对已知攻击类别判定准确率的基础上有效识别新攻击类别。

    一种科技文献检索意图构建方法
    9.
    发明公开

    公开(公告)号:CN110781285A

    公开(公告)日:2020-02-11

    申请号:CN201911045820.1

    申请日:2019-10-30

    IPC分类号: G06F16/332 G06F16/35

    摘要: 本发明公开了一种科技文献检索意图构建方法,包括对文献主题聚类进行可视化,并给出主题关键词供用户交互选择。通过word2vec向量查询用户选择详尽的前五相似概念,并提供给用户交互选择。本发明所提供的基于词表模型的用户检索意图判断方法充分挖掘了用户输入中包含的意图信息并利用了词表模型中的语义关联,通过分析用户检索请求之间的语义关联分析用户可能的检索意图,并在此基础上构建检索式,进行二次精确检索。

    一种基于深度学习的上位词挖掘方法及系统

    公开(公告)号:CN118780281A

    公开(公告)日:2024-10-15

    申请号:CN202310371998.5

    申请日:2023-04-10

    摘要: 本发明提出一种基于深度学习的上位词挖掘方法和系统,包括:获取目标文本和目标文本语言上位词的句法规则,提取目标文本中词语,通过挖掘其共下位词,将词语进行扩展,将词语及其扩展结果作为查询词,通过句法规则在语料库中检索查询词的上位词并进行打分排序,选择分数最高的上位词作为无监督挖掘结果;根据查询词和语料库中候选上位词的嵌入向量,度量查询词和候选上位词是上下位关系的可能性,选择可能性最大的候选上位词嵌入向量对应的候选上位词作为有监督挖掘结果;通过归一化并求和对有监督挖掘结果和无监督挖掘结果进行重打分,选择重打分结果排名最高的有监督挖掘结果和/或无监督挖掘结果作为最终的目标文本的上位词挖掘结果。