热点事件状态评估方法
    21.
    发明授权

    公开(公告)号:CN113779195B

    公开(公告)日:2023-12-22

    申请号:CN202111011061.4

    申请日:2021-08-31

    Abstract: 计。本发明公开的一种热点事件状态评估方法,能够改善评估模型精确性,提高计算效率,本发明通过下述技术方案实现:量化评估模型生成:构建多层次多粒度评估指标体系,基于评估指标体系和评估结论,结合专家知识完成评估指标对评估结论支撑度的判定,生成量化评估模型;语义匹配评估:以量化评估模型为基础,通过指标数据与评估指标的匹配得到量化矩阵图,对每个结论对应的量化权重统计与归一化计算,得到当前热点事件状态的初步定量估计;深度分类评估:根据新矩阵图输出的指标数据+量化标签进行深度分类模型训练,利用分类模型进行指标数(56)对比文件Zengchao Hao 等.A monitoring andprediction system for compound dry andhot events. Environmental ResearchLetters.2019,1-11.S. Fuchs 等.The importance ofindicator weights for vulnerabilityindices and implications for decisionmaking in disastermanagement.International Journal ofDisaster Risk Reduction.2019,1-12.蒋宇 等.面向舆情预测的突发事件首发信息风险评估研究.图书与情报.2016,(第03期),19-26.

    面向任务的文本生成图像网络模型

    公开(公告)号:CN111858954B

    公开(公告)日:2022-12-13

    申请号:CN202010609005.X

    申请日:2020-06-29

    Abstract: 本发明公开的一种面向任务的文本生成图像网络模型,旨在提供一种生成与文本语义一致且内容丰富的高质量图像的文本生成图像网络模型,本发明通过下述技术方案实现:常识推理模块对自然语言文本描述中的实体及实体属性进行丰富和扩充,然后针对自然语言文本描述,分别构建实体关系场景图和实体属性语义向量;全局生成模型将实体关系场景图输入到GCN中,将得到的嵌入向量分别输入掩码回归网络和边界框回归网络,估计出各实体的分割掩码和边界框,融合所有实体布局形成场景布局,结合卷积神经网络生成初始图像;局部细化模型将实体属性语义向量和初始图像特征映射作为输入,结合RRRN和卷积神经网络,生成内容丰富协调的高质量图像。

    关键词语料标注训练提取系统

    公开(公告)号:CN110298033B

    公开(公告)日:2022-07-08

    申请号:CN201910455064.3

    申请日:2019-05-29

    Abstract: 本发明公开的一种关键词语料标注训练提取工具,旨在提供一种可降低人工标注过程繁复度,并能提高海量关键词语料标注效率和准确率的标注训练工具。本发明通过下述技术方案予以实现:关键词语料标注准备模块对不同来源的海量语料数据进行区分,半自动化语料关键词标注模块创建关键词标注任务,自主选择适配算法并开展基于算法模型的自动标注,通过集成CHI、LDA、TEXTRANK、TFIDF中至少一种关键词抽取算法,对待标注文本语料数据进行预标注处理,并对多种算法标注结果进行融合,当标注任务完成后,反馈式关键词标注模型学习训练模块对关键词标注算法模型进行训练;关键词标注模型效果评估模块对模型指标量化标注效果进行自动评估。

    事件知识图谱预测群体性事件的方法

    公开(公告)号:CN112328801B

    公开(公告)日:2022-06-14

    申请号:CN202011043065.6

    申请日:2020-09-28

    Abstract: 本发明公开的一种事件知识图谱预测群体性事件的方法,涉及事件知识图谱挖掘与应用技术。本发明通过下述技术方案予以实现:分预测模型训练和实时预测两个阶段;预测模型训练阶段以历史结构化事件数据为输入数据构建历史事件图谱,采用图嵌入网络学习事件图谱的向量化表示,进而基于深度神经网络建立的分类网络模型来预测事件是否发生;实时预测阶段以实时的结构化事件数据为输入数据构建实时事件图谱,作为已训练完成的事件预测模型的输入数据,将实时事件数据构建的事件图谱输入事件预测模型,获取事件图谱的向量化表示,进而挖掘事件数据的深度语义信息,转化成一个事件发生和不发生的二分类问题,将概率最大的结果作为事件是否发生的预测结果。

    海量高维AIS轨迹数据聚类方法

    公开(公告)号:CN113780395A

    公开(公告)日:2021-12-10

    申请号:CN202111012775.7

    申请日:2021-08-31

    Abstract: 本发明公开的一种海量高维AIS轨迹数据聚类方法,准确率高,运行速度快。本发明他根本下述技术方案实现:依据航向信息分成多条轨迹,对AIS轨迹数据预处理并进行线性插值和数据补全;将预处理后的AIS轨迹数据输入到自编码器网络进行重构训练,输出降维后的轨迹特征嵌入点;基于欧氏距离的k‑means算法,对轨迹特征嵌入点进行聚类,得到初始聚点;将预训练好的编码器加入聚类层构建深度聚类网络,分别计算轨迹特征嵌入点分配给初始聚点的软分配概率,以及属于某个聚类的辅助分配概率,采用梯度下降算法计算二者KL散度,当连续迭代之间的聚类分配变化小于设定值时,聚类过程停止,得到最终聚类结果。

    跨语言多来源垂直领域知识图谱构建方法

    公开(公告)号:CN112199511A

    公开(公告)日:2021-01-08

    申请号:CN202011044895.0

    申请日:2020-09-28

    Abstract: 本发明公开的一种跨语言多来源垂直领域知识图谱构建方法,涉及知识工程技术领域。本发明通过下述技术方案实现:垂直领域翻译根据输入的跨语言文本、领域词典、领域术语库、领域素材和数据,通过内容和链接分析完成平行语料库构建,在预处理的基础上基于训练好的翻译模型实现外文文本的自动翻译;领域知识预标注训练实现基于文本分词、文本聚类的主动学习标注,完成基于分析主题的待标注语料筛选,生成确认后的业务标注数据集;选择最优算法,结合垂直领域翻译数据和实际场景完成语义特征提取和基于深度学习的实体关系抽取;领域知识融合与消歧对不同来源知识,通过网络等价实体合并进行融合消歧,获得跨语言多来源垂直领域知识图谱。

    张量协作图判别分析遥感图像特征提取方法

    公开(公告)号:CN112101381A

    公开(公告)日:2020-12-18

    申请号:CN202010891063.6

    申请日:2020-08-30

    Abstract: 本发明公开的一种张量协作图判别分析遥感图像特征提取方法,旨在提供一种复杂度低、特征提取性能好的有监督特征提取方法。本发明通过下述技术方案实现:以每个像素为中心截取三维的张量数据块;按比例将实验数据划分成训练集和测试集;计算当前训练像素与每个类别训练数据的欧式距离,构建对角权重约束矩阵;然后,设计带约束的L2范数协作表示模型,构建图权重矩阵和张量局部保持投影模型;求取对应张量数据块每一个维度的投影矩阵;最后,利用低维投影矩阵得到三维低维表示的训练集和测试集,并按特征维展开成列向量的形式,将提取到的低维特征输入支持向量机分类器进行分类,判定测试集的类别,以分类效果评估特征提取的性能。

    自动获取多源异构数据知识的方法

    公开(公告)号:CN110489395A

    公开(公告)日:2019-11-22

    申请号:CN201910685511.4

    申请日:2019-07-27

    Abstract: 本发明公开的一种自动获取多源异构数据知识的方法,旨在提供一种更加具有完整性、通用性和便捷性,有利于知识的传递的获取的方法。本发明通过下述技术方案予以实现:采取自顶向下或自底向上的方式定义概念-实体-属性-关系-标签,得到实体对象的知识模型,然后通过数据直接保存和爬虫软件、OCR等识别软件获取数据,得到知识数据,完成异构数据源到异构知识源的转换;通过结构化知识生成方法得到已知知识模式下的实体-属性-关系的三元组实例化;再使用长短期记忆网络模型(LSTM模型)与发布者-完成者协作模式进行知识和知识模型的更新,得到扩展补充新知识的工作流,利用知识建模形成的知识模型,得到包含概念、实体、关系、属性值实例化三元组的数据流。

    文本分类语料标注训练系统

    公开(公告)号:CN110298032A

    公开(公告)日:2019-10-01

    申请号:CN201910455049.9

    申请日:2019-05-29

    Abstract: 本发明公开的一种文本分类语料标注训练系统,旨在提供一种能够降低人工标注反复度,并能提升预标注结果准确性的半自动化标注训练装置。本发明通过下述技术方案予以实现:文本分类语料标注准备模块统计文本词频,去除文本的噪声信息;半自动化文本分类标注模块在分类标注任务中选择CNN、KNN、ANN、深度学习算法,把非结构化和半结构化的文本转换为向量空间模型,生成文本的词向量空间,抽取反映文档主题特征;当标注任务完成后,反馈式模型学习训练模块反馈分类标注模型完善更新;文本分类标注模型效果评估模块基于分类指标规则对评测指标进行量化,建立标注算法综合评估模型,分析测试结果,评价分类结果,对模型指标量化标注效果进行评估。

    半自动化分词语料标注训练装置

    公开(公告)号:CN110287482A

    公开(公告)日:2019-09-27

    申请号:CN201910455093.X

    申请日:2019-05-29

    Abstract: 本发明一种半自动化分词语料标注训练装置,旨在解决分词语料标注及训练过程中使用语料存在的弊端。本发明通过下述技术方案予以实现:文本语料标注准备模块对待标注语料、分词语料的管理,通过基于集成词典的双向最大匹配分词、CRF、JIEBA、等多种分词算法,将生语料分词标注工作提交给半自动化语料分词标注模块,创建分词标注任务,选择标注适用算法模型,开展自动标注,在自动标注结果融合的基础上,将文本语料标注准备模块产生的训练模型语料和标注模型反馈至反馈式模型学习训练模块,选择和模型学习训练,调用统一训练模型接口生成核心词典,更新分词训练模型表,建立标注算法综合评估模型对模型标注效果进行评估,完成新的分词标注任务。

Patent Agency Ranking