-
公开(公告)号:CN111222330B
公开(公告)日:2022-07-12
申请号:CN201911366648.X
申请日:2019-12-26
申请人: 中国电力科学研究院有限公司 , 国网冀北电力有限公司 , 北京邮电大学 , 国家电网有限公司
发明人: 谈元鹏 , 宋磊 , 李思 , 徐会芳 , 彭国政 , 张锐 , 刘剑青 , 王凯 , 王明轩 , 朱明阳 , 蓝海波 , 李晶 , 陆树栋 , 王新迎 , 乔骥 , 张玉天 , 赵紫璇 , 王芳
IPC分类号: G06F40/289 , G06N3/04
摘要: 本发明提供了一种中文事件的检测方法,包括:将待检测文本转换成字符向量序列和词向量序列;将字符向量序列和词向量序列输入预先建立的中文事件检测模型,得到待检测文本的触发词以及对应的事件类型;其中,中文事件检测模型考虑了事件类型间共现关系。本发明对于原基础模型检测输出的不确定结果,利用事件类型间的共现关系,可以在文本中寻找其它事件的分类,对部分错误的输出结果进行更正,提高中文事件检测的性能。
-
公开(公告)号:CN111222330A
公开(公告)日:2020-06-02
申请号:CN201911366648.X
申请日:2019-12-26
申请人: 中国电力科学研究院有限公司 , 国网冀北电力有限公司 , 北京邮电大学 , 国家电网有限公司
发明人: 谈元鹏 , 宋磊 , 李思 , 徐会芳 , 彭国政 , 张锐 , 刘剑青 , 王凯 , 王明轩 , 朱明阳 , 蓝海波 , 李晶 , 陆树栋 , 王新迎 , 乔骥 , 张玉天 , 赵紫璇 , 王芳
IPC分类号: G06F40/289 , G06N3/04
摘要: 本发明提供了一种中文事件的检测方法,包括:将待检测文本转换成字符向量序列和词向量序列;将字符向量序列和词向量序列输入预先建立的中文事件检测模型,得到待检测文本的触发词以及对应的事件类型;其中,中文事件检测模型考虑了事件类型间共现关系。本发明对于原基础模型检测输出的不确定结果,利用事件类型间的共现关系,可以在文本中寻找其它事件的分类,对部分错误的输出结果进行更正,提高中文事件检测的性能。
-
公开(公告)号:CN111767718B
公开(公告)日:2021-12-07
申请号:CN202010636770.0
申请日:2020-07-03
申请人: 北京邮电大学
IPC分类号: G06F40/253 , G06F40/129 , G06N3/04 , G06N3/08
摘要: 本发明提供了一种基于弱化语法错误特征表示的中文语法错误更正方法,在用于中文语法错误更正任务的Transformer神经网络的基础上,通过编码器所提取得到字符特征表示和上下文特征表示,为待纠错文本中每一个字符学习得到一个弱化因子。弱化因子能够通过联合方程将编码器提取得到的字符特征表示和上下文特征表示联合,使得编码器所提取得到的待纠错文本的特征表示中,语法错误的特征信息得到抑制,从而弱化了语法错误特征信息对中文语法错误更正模型的负面影响,提升了基于Transformer的序列到序列神经网络模型在中文语法错误更正任务中的性能。
-
公开(公告)号:CN111767402B
公开(公告)日:2022-04-05
申请号:CN202010635994.X
申请日:2020-07-03
申请人: 北京邮电大学
IPC分类号: G06F16/35 , G06F40/216 , G06F40/289 , G06N3/04 , G06N3/08
摘要: 本发明提供了一种基于对抗学习的限定域事件检测方法,该方法在动态池化卷积神经网络模型的基础上,通过对抗学习的方式,引入约束相同事件类型的数据的特征分布的正则项,使得模型能够学到更多跨触发词的事件分类特征,以此解决基础模型在学习稀疏触发词相关特征时,所学判别性特征不可靠的问题,有利于提高模型在稀疏触发词上的检测性能以及跨领域的泛化性。
-
公开(公告)号:CN111767402A
公开(公告)日:2020-10-13
申请号:CN202010635994.X
申请日:2020-07-03
申请人: 北京邮电大学
IPC分类号: G06F16/35 , G06F40/216 , G06F40/289 , G06N3/04 , G06N3/08
摘要: 本发明提供了一种基于对抗学习的限定域事件检测方法,该方法在动态池化卷积神经网络模型的基础上,通过对抗学习的方式,引入约束相同事件类型的数据的特征分布的正则项,使得模型能够学到更多跨触发词的事件分类特征,以此解决基础模型在学习稀疏触发词相关特征时,所学判别性特征不可靠的问题,有利于提高模型在稀疏触发词上的检测性能以及跨领域的泛化性。
-
公开(公告)号:CN111767718A
公开(公告)日:2020-10-13
申请号:CN202010636770.0
申请日:2020-07-03
申请人: 北京邮电大学
IPC分类号: G06F40/253 , G06F40/129 , G06N3/04 , G06N3/08
摘要: 本发明提供了一种基于弱化语法错误特征表示的中文语法错误更正方法,在用于中文语法错误更正任务的Transformer神经网络的基础上,通过编码器所提取得到字符特征表示和上下文特征表示,为待纠错文本中每一个字符学习得到一个弱化因子。弱化因子能够通过联合方程将编码器提取得到的字符特征表示和上下文特征表示联合,使得编码器所提取得到的待纠错文本的特征表示中,语法错误的特征信息得到抑制,从而弱化了语法错误特征信息对中文语法错误更正模型的负面影响,提升了基于Transformer的序列到序列神经网络模型在中文语法错误更正任务中的性能。
-
公开(公告)号:CN118861281A
公开(公告)日:2024-10-29
申请号:CN202410808838.7
申请日:2024-06-21
申请人: 北京邮电大学
IPC分类号: G06F16/35 , G06F18/24 , G06F40/284 , G06F40/295 , G06F40/289 , G06N3/045 , G06N3/084 , G06N5/04
摘要: 本发明提供了一种基于表达感知最近邻的信息抽取方法,通过引入后交互最近邻算法,将检索词和文本词均映射入向量空间计算,将信息抽取转换为向量检索问题,提高信息抽取的可扩展性、可适应性以及可解释性。在训练阶段,构建了统一的索引结构,结合表达方式相似度计算和几何分布策略进行采样,并使用了类别不平衡损失函数,保证训练过程各个训练实例具有相对一致的优化方向,提高了可扩展性和可适应性;在非训练阶段,通过结合推理阶段检索到的标注样例和LIME算法,本发明可以对抽取的信息实例进行合理解释,提高了可解释性。
-
-
-
-
-
-