-
公开(公告)号:CN111767718A
公开(公告)日:2020-10-13
申请号:CN202010636770.0
申请日:2020-07-03
Applicant: 北京邮电大学
IPC: G06F40/253 , G06F40/129 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于弱化语法错误特征表示的中文语法错误更正方法,在用于中文语法错误更正任务的Transformer神经网络的基础上,通过编码器所提取得到字符特征表示和上下文特征表示,为待纠错文本中每一个字符学习得到一个弱化因子。弱化因子能够通过联合方程将编码器提取得到的字符特征表示和上下文特征表示联合,使得编码器所提取得到的待纠错文本的特征表示中,语法错误的特征信息得到抑制,从而弱化了语法错误特征信息对中文语法错误更正模型的负面影响,提升了基于Transformer的序列到序列神经网络模型在中文语法错误更正任务中的性能。
-
公开(公告)号:CN111767718B
公开(公告)日:2021-12-07
申请号:CN202010636770.0
申请日:2020-07-03
Applicant: 北京邮电大学
IPC: G06F40/253 , G06F40/129 , G06N3/04 , G06N3/08
Abstract: 本发明提供了一种基于弱化语法错误特征表示的中文语法错误更正方法,在用于中文语法错误更正任务的Transformer神经网络的基础上,通过编码器所提取得到字符特征表示和上下文特征表示,为待纠错文本中每一个字符学习得到一个弱化因子。弱化因子能够通过联合方程将编码器提取得到的字符特征表示和上下文特征表示联合,使得编码器所提取得到的待纠错文本的特征表示中,语法错误的特征信息得到抑制,从而弱化了语法错误特征信息对中文语法错误更正模型的负面影响,提升了基于Transformer的序列到序列神经网络模型在中文语法错误更正任务中的性能。
-
公开(公告)号:CN110309512A
公开(公告)日:2019-10-08
申请号:CN201910606372.1
申请日:2019-07-05
Applicant: 北京邮电大学
Abstract: 本发明公开了一种基于生成对抗网络的中文语法错误更正方法,属于信息处理领域。该方法的特征包括:先利用生成网络生成更正语句;利用判别网络计算损失函数,优化生成网络;利用判别网络判别句子更正来源;优化判别网络;对生成网络与判别网络不断迭代优化。本发明通过生成对抗网络,使得中文语法错误更正效果得到提升,具有很大的使用价值。
-
-