一种利用跨语言信息的序列标注方法

    公开(公告)号:CN111274829B

    公开(公告)日:2023-06-16

    申请号:CN202010082779.1

    申请日:2020-02-07

    发明人: 陈欢欢 孙凌浩

    摘要: 本发明公开了一种利用跨语言信息的序列标注方法,通过翻译模型作为纽带将目标语言(高资源语言)下序列标注模型提取的特征迁移到源语言(低资源语言)下序列标注模型中,同时采用反向注意力的机制,通过翻译模型自动学得的注意力参数用来将不同语言间的单词对齐,并通过该机制迁移在目标语言下抽取出来的语言特征。该方法采用端到端模式,模型输入为自然语言句子,输出为标记结果,使用该发明无需进行其他额外处理,方便实际研究与使用,在当前的主流数据集上取得了很好的标注效果。

    一种利用跨语言信息的序列标注方法

    公开(公告)号:CN111274829A

    公开(公告)日:2020-06-12

    申请号:CN202010082779.1

    申请日:2020-02-07

    发明人: 陈欢欢 孙凌浩

    摘要: 本发明公开了一种利用跨语言信息的序列标注方法,通过翻译模型作为纽带将目标语言(高资源语言)下序列标注模型提取的特征迁移到源语言(低资源语言)下序列标注模型中,同时采用反向注意力的机制,通过翻译模型自动学得的注意力参数用来将不同语言间的单词对齐,并通过该机制迁移在目标语言下抽取出来的语言特征。该方法采用端到端模式,模型输入为自然语言句子,输出为标记结果,使用该发明无需进行其他额外处理,方便实际研究与使用,在当前的主流数据集上取得了很好的标注效果。