抽取式机器智能阅读理解问答系统

    公开(公告)号:CN111611361B

    公开(公告)日:2022-06-14

    申请号:CN202010250183.8

    申请日:2020-04-01

    Abstract: 本发明公开的一种抽取式机器智能阅读理解问答系统,旨在提供一种能够提升问答查询效率与实用性的问答系统。本发明通过下述技术方案实现:文档检索模块针对文档库中的海量文本文档,构建全文本搜索引擎ES检索和语义检索两级文档检索体系,形成问答查询的初步文档集;阅读理解模块通过阅读理解预训练模型提取问题与文档深层语义特征,结合语义特征和结构特征,利用多层神经网络模型判断文档存在答案的概率,利用指针网络实现答案的抽取;答案合并预测模块综合阅读理解模型输出的答案对冗余答案进行合并,得到可能的答案列表以及对应的答案概率。模型优化模块通过已标注文档集实现阅读理解模型的训练与优化,为问答系统提供更好的阅读理解模型。

    稀疏判别张量鲁棒性PCA的遥感图像去噪方法

    公开(公告)号:CN111369457B

    公开(公告)日:2022-05-17

    申请号:CN202010129712.9

    申请日:2020-02-28

    Abstract: 本发明公开的一种稀疏判别张量鲁棒性PCA的遥感图像去噪方法,旨在提供一种能更有效除去高光谱图像中噪声的去噪方法,本发明通过下述技术方案实现:对输入高光谱遥感图像进行图像分割,按固定尺寸,将高光谱遥感图像分割成不重叠的张量数据块;分别对每个张量数据块进行稀疏判别张量鲁棒性主成分分析:先将张量数据块分解为低秩分量、稀疏判别分量和稀疏噪声分量,构建稀疏判别张量鲁棒性主成分分析模型,迭代求解该模型得到去噪后的张量数据块,获得去噪图像;对重构去噪后的无噪声数据按比例划分训练集和测试集,最后将训练集和测试集输入到分类器,通过分类器输出所有测试样本的类别标记,实现对高光谱遥感图像去噪效果的评估。

    事件知识图谱预测群体性事件的方法

    公开(公告)号:CN112328801A

    公开(公告)日:2021-02-05

    申请号:CN202011043065.6

    申请日:2020-09-28

    Abstract: 本发明公开的一种事件知识图谱预测群体性事件的方法,涉及事件知识图谱挖掘与应用技术。本发明通过下述技术方案予以实现:分预测模型训练和实时预测两个阶段;预测模型训练阶段以历史结构化事件数据为输入数据构建历史事件图谱,采用图嵌入网络学习事件图谱的向量化表示,进而基于深度神经网络建立的分类网络模型来预测事件是否发生;实时预测阶段以实时的结构化事件数据为输入数据构建实时事件图谱,作为已训练完成的事件预测模型的输入数据,将实时事件数据构建的事件图谱输入事件预测模型,获取事件图谱的向量化表示,进而挖掘事件数据的深度语义信息,转化成一个事件发生和不发生的二分类问题,将概率最大的结果作为事件是否发生的预测结果。

    抽取式机器智能阅读理解问答系统

    公开(公告)号:CN111611361A

    公开(公告)日:2020-09-01

    申请号:CN202010250183.8

    申请日:2020-04-01

    Abstract: 本发明公开的一种抽取式机器智能阅读理解问答系统,旨在提供一种能够提升问答查询效率与实用性的问答系统。本发明通过下述技术方案实现:文档检索模块针对文档库中的海量文本文档,构建全文本搜索引擎ES检索和语义检索两级文档检索体系,形成问答查询的初步文档集;阅读理解模块通过阅读理解预训练模型提取问题与文档深层语义特征,结合语义特征和结构特征,利用多层神经网络模型判断文档存在答案的概率,利用指针网络实现答案的抽取;答案合并预测模块综合阅读理解模型输出的答案对冗余答案进行合并,得到可能的答案列表以及对应的答案概率。模型优化模块通过已标注文档集实现阅读理解模型的训练与优化,为问答系统提供更好的阅读理解模型。

    互联网政治外交类新闻事件抽取方法

    公开(公告)号:CN110941692A

    公开(公告)日:2020-03-31

    申请号:CN201910937986.8

    申请日:2019-09-28

    Abstract: 本发明公开的一种互联网政治外交类新闻事件抽取方法,旨在提供一种能够提高事件识别准确率的抽取方法,本发明通过下述技术方案予以实现:采用人工构建初始触发词集合,根据触发词集合定义事件类别,针对每类事件构建触发词表和包含触发词、事件论元角色的事件类别模板;结合文本依存句法,分析、识别和抽取政外领域事件元素。完成单文本预处理操作,并基于义原相似性计算并扩展类别事件触发词;将满足相似度的阈值的句子作为候选事件句。筛选满足事件类别模板的事件元素,提取事件句中的实体要素;再按照事件模板将事件元素填充到对应的论元角色中;筛选满足类别模板的候选事件元素;按事件模板生成事件的结构化描述文件,构建出政外领域事件库。

    多模态知识图谱构建方法
    17.
    发明授权

    公开(公告)号:CN112200317B

    公开(公告)日:2024-05-07

    申请号:CN202011043062.2

    申请日:2020-09-28

    Abstract: 本发明公开的一种多模态知识图谱构建方法,涉及大数据领域知识工程技术,本发明通过下述技术方案予以实现:首先基于多模态数据特征表示模型提取多模态数据语义特征,构建基于预训练模型的文本、图像、音视频等数据特征提取模型,分别完成单模态数据语义特征提取;其次,基于无监督图、属性图、异构图嵌入等方式,将不同类型数据投射到同一向量空间中进行表示,实现跨模态的多模态知识表示;在上述工作的基础上,将需要进行融合对齐的两个图谱分别转化为向量表示形式,然后基于得到的多模态知识表示,根据先验对齐数据学习知识图谱间实体对的映射关系,完成多模态知识融合消歧,解码映射到知识图谱中的相应节点,生成融合后新图谱、实体及其属性。

    一种常识约束的事件推理溯源方法

    公开(公告)号:CN117610665A

    公开(公告)日:2024-02-27

    申请号:CN202311544615.6

    申请日:2023-11-17

    Abstract: 本申请的实施例提供了一种常识约束的事件推理溯源方法,涉及自然语言处理技术领域,所述方法包括:从数据库中获取多个典型事件;基于事件内容和事件常识对多个所述典型事件进行排序整合,得到核心事件脉络序列;基于事件常识对所述核心事件脉络序列进行脉络关键节点推理,得到包含关键信息的关键事件脉络序列;以事件发生时间为约束条件,在所述约束条件下对所述关键事件脉络序列进行随机游走推理,得到溯源结果。本申请的技术方案,通过核心事件脉络生成和常识推理,实现事件溯源,可以有效提升事件发生起因发现的准确性和可解释性。

    多类型事件预测模型
    19.
    发明授权

    公开(公告)号:CN113962294B

    公开(公告)日:2023-05-16

    申请号:CN202111159151.8

    申请日:2021-09-30

    Abstract: 本发明公开的一种多类型事件预测模型,涉及事件分析与处理领域。本发明通过下述技术方案实现:事件异构时序图构建模块以事件描述数据库为基础,以所有要素为邻域节点,构建事件异构时序图,通过关系图神经网络模型获取事件发生时间节点的特征向量;组合特征提取模块提取时间节点特征向量组合时间段内事件的组合特征信息,按时间顺序排列输出组合特征向量;时序特征提取模块将组合特征向量送入时序特征提取模块,输出具备时序特征的向量;多标签分类器模块将时序特征提取模块输出的向量进行扁平化处理,控制神经网络输出层向量维度与被预测事件类型数量保持一致,最终全连接深度神经网络通过激活函数层,可视化输出每种类型事件发生的概率值。

    一种多维度文本综合辨识方法
    20.
    发明公开

    公开(公告)号:CN115994531A

    公开(公告)日:2023-04-21

    申请号:CN202211324458.3

    申请日:2022-10-27

    Abstract: 本发明公开了一种多维度文本综合辨识方法,包括:获取待辨识文本,并将其划分为多个分句;对所述多个分句进行常识检测,得到第一文本真实概率和常识冲突列表;对所述多个分句进行事实检测,得到第二文本真实概率和事实冲突列表;对所述多个分句进行内容检测,得到第三文本真实概率以及支撑判断结果的句子和词语;基于所述第一文本真实概率、所述第二文本真实概率和所述第三文本真实概率,得到文本综合辨识结果。本发明不仅能够对文本进行常识符合性、事实符合度以及文本内容的全维综合辨识,还能够对辨识结果进行可解释性分析,以综合辨识报告的形式呈现。

Patent Agency Ranking