一种基于实体扩展的实体识别方法和系统
摘要:
本申请涉及一种基于实体扩展的实体识别方法和系统,其中,该方法包括:通过多种短语挖掘方法对无标签语料的句子进行分割,得到概念词候选集,其中,概念词候选集包含若干概念词,通过词嵌入算法对概念词进行训练,得到概念词的词向量,根据词向量计算概念词的文本特征,根据领域实体词列表将概念词设置为正负样本,根据正负样本和文本特征来训练分类模型,得到概念词的置信度,根据置信度进行重新分割,得到基于实体扩展的实体词。通过本申请,解决了实体识别中对标注样本依赖性强和识别准确率低的问题。实现了利用领域实体词列表进行监督学习,得到无标签语料的实体识别结果,同时达到了对领域实体词列表进行扩充的效果。
公开/授权文献
0/0