-
公开(公告)号:CN112800756B
公开(公告)日:2022-05-10
申请号:CN202011334119.4
申请日:2020-11-25
申请人: 重庆邮电大学
IPC分类号: G06F40/284 , G06N3/04 , G06N3/08
摘要: 本发明涉及计算机网络技术领域,特别涉及一种基于PRADO的实体识别方法,包括获取原始数据,并对原始数据进行分词、标注处理;在PRADO层,基于投影嵌入模型,使用局部敏感哈希构建投影网络,将句子中的每个字转化为低维的Embedding词表;利用BiLSTM神经网络上下文关联的特点提取Embedding向量特征;将BiLSTM层获取的特征向量通过注意力机制的方法分配以不同的注意力权重;利用CRF完成序列标注的任务;本发明采用LSH算法来构建投影网络,以达到减少词嵌入向量参数的目的,同时使用注意力机制来保证该特征向量与全文的联系,来消除LSH算法不能较好的联系上下文的隐患。
-
公开(公告)号:CN112800756A
公开(公告)日:2021-05-14
申请号:CN202011334119.4
申请日:2020-11-25
申请人: 重庆邮电大学
IPC分类号: G06F40/284 , G06N3/04 , G06N3/08
摘要: 本发明涉及计算机网络技术领域,特别涉及一种基于PRADO的实体识别方法,包括获取原始数据,并对原始数据进行分词、标注处理;在PRADO层,基于投影嵌入模型,使用局部敏感哈希构建投影网络,将句子中的每个字转化为低维的Embedding词表;利用BiLSTM神经网络上下文关联的特点提取Embedding向量特征;将BiLSTM层获取的特征向量通过注意力机制的方法分配以不同的注意力权重;利用CRF完成序列标注的任务;本发明采用LSH算法来构建投影网络,以达到减少词嵌入向量参数的目的,同时使用注意力机制来保证该特征向量与全文的联系,来消除LSH算法不能较好的联系上下文的隐患。
-