-
公开(公告)号:CN110287481A
公开(公告)日:2019-09-27
申请号:CN201910455086.X
申请日:2019-05-29
Applicant: 西南电子技术研究所(中国电子科技集团公司第十研究所)
IPC: G06F17/27
Abstract: 本发明公开的一种命名实体语料标注训练系统,旨在提供一种能够提高命名实体识别的准确率、正确率、召回率的命名实体识别的半自动化标注训练装置。本发明通过下述技术方案予以实现:命名实体语料标注准备模块在标注过程中提供可选择适用的标注算法;半自动化语料命名实体标注模块自主选择适配算法并开展自动标注,基于命名实体提取算法中至少一个命名实体抽取算法,对待标注文本语料数据进行单一命名实体的预标注处理;当标注任务完成后,反馈式模型学习训练模块使用标注语料对命名实体模型进行训练,自动反馈调整完成新的命名实体标注任务;命名实体标注模型效果评估模块对模型指标量化标注效果进行评估,根据评估结果推荐默认最适算法模型。
-
公开(公告)号:CN109710728A
公开(公告)日:2019-05-03
申请号:CN201811417992.2
申请日:2018-11-26
Applicant: 西南电子技术研究所(中国电子科技集团公司第十研究所)
Abstract: 本发明公开的一种新闻话题自动发现方法,旨在提供一种能够提高新闻话题发现的准确性的方法。本发明通过下述技术方案予以实现:首先设置增量聚类相关参数和增量聚类触发参数,对增量数据进行分批次聚类,预处理输入文本,对文章统一文本格式编码,计算文本特征,生成文本特征向量,提取文本特征词,构建文本特征向量集,在批次内先做主题聚类,再做主题内层次聚类,然后计算每一个单点主题与所有聚类的相似度即每一个单点到每一个聚类中心的距离,合并到最大的类簇,将跨批次的聚类互相凝聚起来,完成主题间层次聚类;生成新闻话题并进行新类簇融合,将新类簇质心与已有历史类簇质心进行比较,然后对新增数据聚类结果与已有聚类结果做跨批次融合。
-
公开(公告)号:CN113780395B
公开(公告)日:2023-02-03
申请号:CN202111012775.7
申请日:2021-08-31
Applicant: 西南电子技术研究所(中国电子科技集团公司第十研究所)
IPC: G06F18/23213 , G06F18/22 , G06F18/214 , G06N3/0455 , G06N3/08
Abstract: 本发明公开的一种海量高维AIS轨迹数据聚类方法,准确率高,运行速度快。本发明他根本下述技术方案实现:依据航向信息分成多条轨迹,对AIS轨迹数据预处理并进行线性插值和数据补全;将预处理后的AIS轨迹数据输入到自编码器网络进行重构训练,输出降维后的轨迹特征嵌入点;基于欧氏距离的k‑means算法,对轨迹特征嵌入点进行聚类,得到初始聚点;将预训练好的编码器加入聚类层构建深度聚类网络,分别计算轨迹特征嵌入点分配给初始聚点的软分配概率,以及属于某个聚类的辅助分配概率,采用梯度下降算法计算二者KL散度,当连续迭代之间的聚类分配变化小于设定值时,聚类过程停止,得到最终聚类结果。
-
公开(公告)号:CN112199511B
公开(公告)日:2022-07-08
申请号:CN202011044895.0
申请日:2020-09-28
Applicant: 西南电子技术研究所(中国电子科技集团公司第十研究所)
IPC: G06F16/36 , G06F40/49 , G06F40/58 , G06F40/295 , G06F16/35
Abstract: 本发明公开的一种跨语言多来源垂直领域知识图谱构建方法,涉及知识工程技术领域。本发明通过下述技术方案实现:垂直领域翻译根据输入的跨语言文本、领域词典、领域术语库、领域素材和数据,通过内容和链接分析完成平行语料库构建,在预处理的基础上基于训练好的翻译模型实现外文文本的自动翻译;领域知识预标注训练实现基于文本分词、文本聚类的主动学习标注,完成基于分析主题的待标注语料筛选,生成确认后的业务标注数据集;选择最优算法,结合垂直领域翻译数据和实际场景完成语义特征提取和基于深度学习的实体关系抽取;领域知识融合与消歧对不同来源知识,通过网络等价实体合并进行融合消歧,获得跨语言多来源垂直领域知识图谱。
-
公开(公告)号:CN111368691B
公开(公告)日:2022-06-14
申请号:CN202010128995.5
申请日:2020-02-28
Applicant: 西南电子技术研究所(中国电子科技集团公司第十研究所)
IPC: G06V20/13 , G06V10/26 , G06V10/77 , G06V10/776 , G06V10/778 , G06K9/62
Abstract: 本发明公开的一种无监督的高光谱遥感图像空谱特征提取方法。旨在提供一种可以实现对高光谱遥感图像的无监督空谱特征提取,能够获得更高高光谱影像分类精度的图像空谱特征提取方法,本发明通过下述技术方案实现:按指定尺度将原始图像分割成相同大小不重叠的子图像块,并对每个子图像块进行张量鲁棒性投影学习运算,得到低维特征表示的低维投影矩阵;以三阶张量运算完成高光谱数据的空间结构挖掘,将低维投影融入张量鲁棒性主成分分析模型,构建无监督张量鲁棒性投影学习模型,获取每个子图像块的低维特征;按设定比例划分训练集和测试集,利用最近邻分类器对测试集进行分类,得到测试样本的类别,实现对高光谱遥感图像的无监督空谱特征提取。
-
公开(公告)号:CN113962294A
公开(公告)日:2022-01-21
申请号:CN202111159151.8
申请日:2021-09-30
Applicant: 西南电子技术研究所(中国电子科技集团公司第十研究所)
Abstract: 本发明公开的一种多类型事件预测模型,涉及事件分析与处理领域。本发明通过下述技术方案实现:事件异构时序图构建模块以事件描述数据库为基础,以所有要素为邻域节点,构建事件异构时序图,通过关系图神经网络模型获取事件发生时间节点的特征向量;组合特征提取模块提取时间节点特征向量组合时间段内事件的组合特征信息,按时间顺序排列输出组合特征向量;时序特征提取模块将组合特征向量送入时序特征提取模块,输出具备时序特征的向量;多标签分类器模块将时序特征提取模块输出的向量进行扁平化处理,控制神经网络输出层向量维度与被预测事件类型数量保持一致,最终全连接深度神经网络通过激活函数层,可视化输出每种类型事件发生的概率值。
-
公开(公告)号:CN112287118A
公开(公告)日:2021-01-29
申请号:CN202011190740.8
申请日:2020-10-30
Applicant: 西南电子技术研究所(中国电子科技集团公司第十研究所)
Abstract: 本发明公开的一种事件模式频繁子图挖掘与预测方法,涉及知识工程技术领域,旨在降低挖掘开销,提升挖掘速度。本发明通过下述技术方案实现:在基于密度的图摘要阶段将基于密度图摘要图中的节点划分成簇或者超级节点,依次选取节点构建一个简洁的高层次的图;在模式挖掘阶段,在大规模的事件图谱上进行频繁子图挖掘,基于事件模式挖掘频繁子图,在事件图谱的图集中找到频繁出现的子图;基于图摘要算法对输入图G进行摘要,以摘要结果为输入进行频繁子图挖掘和基于图摘要的挖掘预处理;最后,利用多源数据,从多方来源多个角度进行事件模式的挖掘与预测,根据用户定义的最小支持度min_sup或其他输出标准进行候选集过滤和频繁子图输出。
-
公开(公告)号:CN112101536A
公开(公告)日:2020-12-18
申请号:CN202010891060.2
申请日:2020-08-30
Applicant: 西南电子技术研究所(中国电子科技集团公司第十研究所)
Abstract: 本发明公开的一种轻量级分布式多任务协同框架,旨在提供一种训练效率高,迭代计算量小的多任务协同框架。本发明通过下述技术方案予以实现:以多机轻量级方式构建分布式神经网络训练框架,用户通过接口对框架进行数据读写和运行控制,各对象将自身的描述信息写入对象信息记录数据库,将自身的运行状态信息写入对象状态记录数据库;对象信息记录数据库、对象状态记录数据库相互之间通过RESTful接口进行通信和协同控制;启动任务对象描述的训练任务,调度工厂对象生成一个班长对象,从对象信息记录数据库中再次读取任务对象的描述信息,调度工厂对象生成多个工人对象,班长对象调度生成的多个工人对象分布式协同完成任务对象描述的训练任务。
-
公开(公告)号:CN111681174A
公开(公告)日:2020-09-18
申请号:CN202010355045.6
申请日:2020-04-29
Applicant: 西南电子技术研究所(中国电子科技集团公司第十研究所)
IPC: G06T5/00
Abstract: 本发明公开的一种抑制椒盐/高斯混噪目标图像的联合滤波方法,旨在提供一种能有效解决传统算法在高强度椒盐-高斯混噪图像下失效问题的抑制椒盐-高斯混合噪声的方法,本发明通过下述技术方案予以实现:首先,获取可见光图像,设定扩展窗口阈值,确定初始滤波窗口,进行滤波窗口噪声点辨识,采取滤波窗口自适应的方式,对含噪目标图像进行椒盐噪声点辨识,判断是否为高强度椒盐噪声点,在辨识的过程中不断扩展滤波窗口大小,并计算各滤波窗口的归一化系数和一次加权联合滤波中间输出,然后,根据多层窗口中间输出值进行二次加权滤波,最后,在自适应中值滤波过程中使用均值分割,加速寻找中值的速度,实现椒盐-高斯混噪图像快速自适应滤波。
-
公开(公告)号:CN109684373A
公开(公告)日:2019-04-26
申请号:CN201811419419.5
申请日:2018-11-26
Applicant: 西南电子技术研究所(中国电子科技集团公司第十研究所)
IPC: G06F16/2458 , G06F16/28 , G06Q50/00
CPC classification number: G06Q50/01
Abstract: 本发明提出的一种基于出行和话单数据分析的重点关系人发现方法,旨在提供一种高效准确、识别率高的重点关系人发现方法,本发明通过下述技术方案予以实现:同行关系人发现模块利用航班和火车出行数据,采用同行规律挖掘算法得到与目标人物一起出行的同行关系人特征数据列表;通联关系人发现模块利用话单数据,采用通联规律统计算法计算目标人物所有通话记录的通联频次和通联时长,通联频次降序排列得到通联关系人特征数据列表1,表2;关系人类型判定模块利用话单数据分析目标人物和重点关系人特征数据列表人员的停留时空规律,根据关系人类型判定规则判定重点关系人的类型,得到带有关系人类型的重点关系人特征数据列表。
-
-
-
-
-
-
-
-
-