专利检索 ap:("中国科学技术大学") AND inv:"孙凌浩" 第 1 页

1.

发明授权
一种利用跨语言信息的序列标注方法有权

公开(公告)号：CN111274829B

公开(公告)日：2023-06-16

申请号：CN202010082779.1

申请日：2020-02-07

申请人： 中国科学技术大学

发明人： 陈欢欢 , 孙凌浩

IPC分类号： G06F40/58 , G06F40/295 , G06F40/169 , G06F16/35

摘要： 本发明公开了一种利用跨语言信息的序列标注方法，通过翻译模型作为纽带将目标语言(高资源语言)下序列标注模型提取的特征迁移到源语言(低资源语言)下序列标注模型中，同时采用反向注意力的机制，通过翻译模型自动学得的注意力参数用来将不同语言间的单词对齐，并通过该机制迁移在目标语言下抽取出来的语言特征。该方法采用端到端模式，模型输入为自然语言句子，输出为标记结果，使用该发明无需进行其他额外处理，方便实际研究与使用，在当前的主流数据集上取得了很好的标注效果。

2.

发明公开
一种利用跨语言信息的序列标注方法审中-实审

公开(公告)号：CN111274829A

公开(公告)日：2020-06-12

申请号：CN202010082779.1

申请日：2020-02-07

申请人： 中国科学技术大学

发明人： 陈欢欢 , 孙凌浩

IPC分类号： G06F40/58 , G06F40/295 , G06F40/169 , G06F16/35

摘要： 本发明公开了一种利用跨语言信息的序列标注方法，通过翻译模型作为纽带将目标语言(高资源语言)下序列标注模型提取的特征迁移到源语言(低资源语言)下序列标注模型中，同时采用反向注意力的机制，通过翻译模型自动学得的注意力参数用来将不同语言间的单词对齐，并通过该机制迁移在目标语言下抽取出来的语言特征。该方法采用端到端模式，模型输入为自然语言句子，输出为标记结果，使用该发明无需进行其他额外处理，方便实际研究与使用，在当前的主流数据集上取得了很好的标注效果。