一种文本实体关系抽取方法、系统、设备及介质

    公开(公告)号:CN115495575A

    公开(公告)日:2022-12-20

    申请号:CN202210987505.6

    申请日:2022-08-17

    摘要: 一种文本实体关系抽取方法、系统、设备及介质,包括:将待分类的能源电力文档语料采用词向量处理工具进行处理,得到所述待分类的能源电力文档语料的特征向量;将所述特征向量输入预先训练好的支持向量机分类模型中,计算得到所述特征向量的决策函数,若决策函数的绝对值在所述设定范围,则得到待分类的能源电力文档语料的类别;否则,将不在设定范围的决策函数对应的特征向量采用预先训练好的KNN分类器进行二次分类,得到待分类的能源电力文档语料的类别;其中,支持向量机分类模型是基于标注了类别的能源电力文档语料对应的特征向量集合对支持向量机进行训练得到的。本发明融合了支持向量机分类模型和KNN分类器,兼顾了实体关系抽取的效率和精度。