一种多类型实体识别的多任务深度学习模型的训练方法
摘要:
本发明适用于数据抽取技术领域,提供一种多类型实体识别的多任务深度学习模型的训练方法及装置,所述方法包括:数据预处理;建立skip‑gram神经网络模型将预处理后的文本语料数据转为向量;根据要识别和提取的实体类型构建样本数据集;构建样本数据的分词特征;建立多类型实体识别的多任务深度学习模型。本发明中,相关类型的实体采用参数共享的方式实现共同特征的提取,又使用独立的模型完成实体的标注,使得模型对于一个文本数据的多种实体识别和提取有更好的泛化能力,即实体识别的整体正确性得到提升;另外,本发明只训练一个模型,在一次迭代过程中共同特征只用训练一次,可以极大的缩减训练时间。
0/0