-
公开(公告)号:CN111274829B
公开(公告)日:2023-06-16
申请号:CN202010082779.1
申请日:2020-02-07
申请人: 中国科学技术大学
IPC分类号: G06F40/58 , G06F40/295 , G06F40/169 , G06F16/35
摘要: 本发明公开了一种利用跨语言信息的序列标注方法,通过翻译模型作为纽带将目标语言(高资源语言)下序列标注模型提取的特征迁移到源语言(低资源语言)下序列标注模型中,同时采用反向注意力的机制,通过翻译模型自动学得的注意力参数用来将不同语言间的单词对齐,并通过该机制迁移在目标语言下抽取出来的语言特征。该方法采用端到端模式,模型输入为自然语言句子,输出为标记结果,使用该发明无需进行其他额外处理,方便实际研究与使用,在当前的主流数据集上取得了很好的标注效果。
-
公开(公告)号:CN111274829A
公开(公告)日:2020-06-12
申请号:CN202010082779.1
申请日:2020-02-07
申请人: 中国科学技术大学
IPC分类号: G06F40/58 , G06F40/295 , G06F40/169 , G06F16/35
摘要: 本发明公开了一种利用跨语言信息的序列标注方法,通过翻译模型作为纽带将目标语言(高资源语言)下序列标注模型提取的特征迁移到源语言(低资源语言)下序列标注模型中,同时采用反向注意力的机制,通过翻译模型自动学得的注意力参数用来将不同语言间的单词对齐,并通过该机制迁移在目标语言下抽取出来的语言特征。该方法采用端到端模式,模型输入为自然语言句子,输出为标记结果,使用该发明无需进行其他额外处理,方便实际研究与使用,在当前的主流数据集上取得了很好的标注效果。
-