-
公开(公告)号:CN110008307B
公开(公告)日:2021-12-28
申请号:CN201910048233.1
申请日:2019-01-18
Applicant: 中国科学院信息工程研究所
IPC: G06F16/33 , G06F16/35 , G06F40/289
Abstract: 本发明涉及一种基于规则和统计学习的变形实体识别方法和装置。该方法定义目标实体生成变形实体的规则,并且通过这些规则定义演绎生成算法,为每个目标实体生成大量的候选变形实体集合;利用目标实体和变形实体所在文本的上下文语义相似性,提出基于统计学习的方法来识别出上面候选变形实体集合中真正对应于目标实体的变形实体。本发明既可以找到尽可能多的变形实体,又通过识别模型保证了最终识别出的变形实体的准确性,具有良好的实用性。
-
公开(公告)号:CN109902145A
公开(公告)日:2019-06-18
申请号:CN201910048837.6
申请日:2019-01-18
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于注意力机制的实体关系联合抽取方法和系统。该方法的步骤包括:将训练数据中标注的实体和关系的三元组,转化为每个词对应一个预定义类型的标签的形式;将训练数据的句子中的每个词映射成对应的词向量,输入基于注意力机制的神经网络模型,并通过反向传播算法进行训练,得到标签预测模型;将需进行实体关系抽取的句子输入训练完成的标签预测模型,预测出每个词对应的标签,根据标签和三元组中每个词的对应关系,得到句子中存在的实体关系三元组。该系统包括预处理模块、模型训练模块和结果处理模块。本发明通过更有效的利用句子中的关键信息,提升了关系实体联合抽取的性能,具有良好的实用性。
-
公开(公告)号:CN110569355A
公开(公告)日:2019-12-13
申请号:CN201910671527.X
申请日:2019-07-24
Applicant: 中国科学院信息工程研究所
Abstract: 本发明提出一种基于词块的观点目标抽取和目标情感分类联合方法及系统,具体为:对于每个连续词块,设计词块级别的特征以此来充分利用多个词之间的整体信息;计算每个词块的情感信息而非单独计算每一个词的情感信息,这样保证词块里多个词的情感倾向的一致性。本发明一是通过有效利用多个词整体信息,二是通过为多个词组成的词块计算一个情感信息表示来避免情感不一致的问题,来提升抽取和分类的准确率,具有良好的实用性。
-
公开(公告)号:CN110569355B
公开(公告)日:2022-05-03
申请号:CN201910671527.X
申请日:2019-07-24
Applicant: 中国科学院信息工程研究所
IPC: G06F16/35 , G06F16/33 , G06F40/289
Abstract: 本发明提出一种基于词块的观点目标抽取和目标情感分类联合方法及系统,具体为:对于每个连续词块,设计词块级别的特征以此来充分利用多个词之间的整体信息;计算每个词块的情感信息而非单独计算每一个词的情感信息,这样保证词块里多个词的情感倾向的一致性。本发明一是通过有效利用多个词整体信息,二是通过为多个词组成的词块计算一个情感信息表示来避免情感不一致的问题,来提升抽取和分类的准确率,具有良好的实用性。
-
公开(公告)号:CN116189039A
公开(公告)日:2023-05-30
申请号:CN202211676172.1
申请日:2022-12-26
Applicant: 中国科学院信息工程研究所
IPC: G06V20/40 , G06V10/764 , G06V10/77 , G06V10/80 , G06V10/82 , G06N3/08 , G06N3/0464
Abstract: 本发明提出一种全局音频特征增强的模态顺序感知的多模态情感分类方法及系统,具体为:设计了跨模态融合模块,先提取文本信息,再融合音频信息,最后加入视觉信息,从而得到模态融合特征;对整个视频提取全局的音频特征,以最大程度地保留视频整体音调变化等声学特征;最后将模态融合特征和全局音频特征进行融合。本发明一是通过顺序融合的方法,既充分提取了核心模态(文本、音频)的特征,又减少了视觉模态中噪声的影响;二是使用视频全局的音频信息加强对视频情感的获取,来提升情感分类的准确性。
-
公开(公告)号:CN109902145B
公开(公告)日:2021-04-20
申请号:CN201910048837.6
申请日:2019-01-18
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于注意力机制的实体关系联合抽取方法和系统。该方法的步骤包括:将训练数据中标注的实体和关系的三元组,转化为每个词对应一个预定义类型的标签的形式;将训练数据的句子中的每个词映射成对应的词向量,输入基于注意力机制的神经网络模型,并通过反向传播算法进行训练,得到标签预测模型;将需进行实体关系抽取的句子输入训练完成的标签预测模型,预测出每个词对应的标签,根据标签和三元组中每个词的对应关系,得到句子中存在的实体关系三元组。该系统包括预处理模块、模型训练模块和结果处理模块。本发明通过更有效的利用句子中的关键信息,提升了关系实体联合抽取的性能,具有良好的实用性。
-
公开(公告)号:CN110008307A
公开(公告)日:2019-07-12
申请号:CN201910048233.1
申请日:2019-01-18
Applicant: 中国科学院信息工程研究所
Abstract: 本发明涉及一种基于规则和统计学习的变形实体识别方法和装置。该方法定义目标实体生成变形实体的规则,并且通过这些规则定义演绎生成算法,为每个目标实体生成大量的候选变形实体集合;利用目标实体和变形实体所在文本的上下文语义相似性,提出基于统计学习的方法来识别出上面候选变形实体集合中真正对应于目标实体的变形实体。本发明既可以找到尽可能多的变形实体,又通过识别模型保证了最终识别出的变形实体的准确性,具有良好的实用性。
-
-
-
-
-
-