命名实体语料标注训练系统

    公开(公告)号:CN110287481B

    公开(公告)日:2022-06-14

    申请号:CN201910455086.X

    申请日:2019-05-29

    IPC分类号: G06F40/295

    摘要: 本发明公开的一种命名实体语料标注训练系统,旨在提供一种能够提高命名实体识别的准确率、正确率、召回率的命名实体识别的半自动化标注训练装置。本发明通过下述技术方案予以实现:命名实体语料标注准备模块在标注过程中提供可选择适用的标注算法;半自动化语料命名实体标注模块自主选择适配算法并开展自动标注,基于命名实体提取算法中至少一个命名实体抽取算法,对待标注文本语料数据进行单一命名实体的预标注处理;当标注任务完成后,反馈式模型学习训练模块使用标注语料对命名实体模型进行训练,自动反馈调整完成新的命名实体标注任务;命名实体标注模型效果评估模块对模型指标量化标注效果进行评估,根据评估结果推荐默认最适算法模型。

    中心词跨句事件论元检测方法

    公开(公告)号:CN114036955A

    公开(公告)日:2022-02-11

    申请号:CN202111278186.3

    申请日:2021-10-30

    摘要: 本发明提出的一种中心词跨句事件论元检测方法,能够减少跨句论元检测复杂度、提高准确率。通过下述技术方案实现:语料预处理建立候选中心词集、计算候选中心词及触发词的浅层语义向量、深层语义向量,基于双仿射变换神经网络模型检测到触发词关联依存弧,基于再一次双仿射变换检出触发词对应中心词并完成论元分类;从中心词‑论元类别集中取中心词,从中心词的临近词语中检测出论元,将其动态词、位置向量拼接后输入多层感知机MLP模型,实现特征建模,通过MLP模型计算出中心词的临近词作为论元边界词的归一化概率值,确定论元边界,得到完整的事件论元。选择概率最大的词作词语集合拼接作为中心词对应的完整论元,完成跨句的事件论元检测。

    多模态知识图谱构建方法
    83.
    发明公开

    公开(公告)号:CN112200317A

    公开(公告)日:2021-01-08

    申请号:CN202011043062.2

    申请日:2020-09-28

    IPC分类号: G06N5/02 G06F16/36

    摘要: 本发明公开的一种多模态知识图谱构建方法,涉及大数据领域知识工程技术,本发明通过下述技术方案予以实现:首先基于多模态数据特征表示模型提取多模态数据语义特征,构建基于预训练模型的文本、图像、音视频等数据特征提取模型,分别完成单模态数据语义特征提取;其次,基于无监督图、属性图、异构图嵌入等方式,将不同类型数据投射到同一向量空间中进行表示,实现跨模态的多模态知识表示;在上述工作的基础上,将需要进行融合对齐的两个图谱分别转化为向量表示形式,然后基于得到的多模态知识表示,根据先验对齐数据学习知识图谱间实体对的映射关系,完成多模态知识融合消歧,解码映射到知识图谱中的相应节点,生成融合后新图谱、实体及其属性。

    统一检索跨媒体信息的CMR模型
    84.
    发明公开

    公开(公告)号:CN111680173A

    公开(公告)日:2020-09-18

    申请号:CN202010481108.2

    申请日:2020-05-31

    摘要: 本发明公开的一种统一检索跨媒体信息的CMR模型,旨在提供一种信息准确、快速的跨媒体检索模型。本发明通过下述技术方案实现:多模态媒体信息语义特征统一表达与关联模块查询输入和跨媒体数据模块输入的异构信息,基于多模态语义特征提取结果及底层特征到高层语义特征的映射,将多模态语义特征映射到同一特征空间中并构建多模语义关联规则,实现跨媒体信息底层特征与高层语义特征之间的关联和不同模态信息高层语义的关联;跨媒体数据索引构建模块针对多模态数据特征建立多维度检索索引;跨媒体检索模型构建模块基于本体、语义网络和知识图谱技术,实现多模态信息的统一检索;检索结果经过多模态检索结果关联印证与组织模块实现冲突检测和自组织。

    复杂环境目标经典航迹提取方法

    公开(公告)号:CN109000645A

    公开(公告)日:2018-12-14

    申请号:CN201810381867.4

    申请日:2018-04-26

    IPC分类号: G01C21/20 G06K9/62

    摘要: 本发明提出了一种复杂环境下的目标经典航迹提取方法。利用本发明可实现目标航迹数据随机性强、噪声大、航迹长短不一、点迹间隔差异大等复杂条件下的目标经典航迹的提取。本发明通过下述技术方案予以实现:读取目标航迹数据,根据航迹数据中不同属性的取值范围约束进行预筛选,去除异常数据项;栅格化经纬度网格,统计每个经纬度网格中的点迹密度,并提取点迹密度较大的网格中的所有航迹数据和过滤航迹数据;采用多距离阈值DBSCAN聚类算法对过滤后的航迹数据进行聚类形成多个航迹聚类簇;针对每一个聚类簇设置扫描线,依次计算扫描线与航迹交点平均值得到目标经典航迹中的点迹,并按先后顺序连接点迹,得到目标经典航迹提取结果。