属性词识别及其层次构建方法、装置、设备及存储介质

    公开(公告)号:CN109492214B

    公开(公告)日:2023-09-19

    申请号:CN201710813362.6

    申请日:2017-09-11

    IPC分类号: G06F40/284

    摘要: 本发明提供一种属性词识别方法及装置,包括:获取评论语料的名词词表;获取上下位关系矩阵,所述上下位关系矩阵为种子词与种子词的下位词的上下位关系的矩阵;根据所述上下位关系矩阵及所述名词词表中的各词,确定所述名词词表中各词的预测上位词向量,所述预测上位词向量为所述上下位关系矩阵与词的词向量的乘积;根据各词的所述预测上位词向量确定种子词的属性词。该方法及装置,仅需通过少量人力资源确定种子词,而无需通过大量的人力资源,便可以确定与种子词相关的属性词,从而降低了人力资源消耗量。本发明还提供一种与上述属性词识别方法及装置对应的属性词的层次构建方法及装置,以及一种计算机设备及计算机存储介质。

    属性词识别及其层次构建方法、装置、设备及存储介质

    公开(公告)号:CN109492214A

    公开(公告)日:2019-03-19

    申请号:CN201710813362.6

    申请日:2017-09-11

    IPC分类号: G06F17/27

    摘要: 本发明提供一种属性词识别方法及装置,包括:获取评论语料的名词词表;获取上下位关系矩阵,所述上下位关系矩阵为种子词与种子词的下位词的上下位关系的矩阵;根据所述上下位关系矩阵及所述名词词表中的各词,确定所述名词词表中各词的预测上位词向量,所述预测上位词向量为所述上下位关系矩阵与词的词向量的乘积;根据各词的所述预测上位词向量确定种子词的属性词。该方法及装置,仅需通过少量人力资源确定种子词,而无需通过大量的人力资源,便可以确定与种子词相关的属性词,从而降低了人力资源消耗量。本发明还提供一种与上述属性词识别方法及装置对应的属性词的层次构建方法及装置,以及一种计算机设备及计算机存储介质。

    一种跑题作文确定方法及装置

    公开(公告)号:CN106126613A

    公开(公告)日:2016-11-16

    申请号:CN201610457062.4

    申请日:2016-06-22

    申请人: 苏州大学

    发明人: 陈志鹏 陈文亮

    IPC分类号: G06F17/30 G06K9/62

    CPC分类号: G06F16/335 G06K9/6215

    摘要: 本发明公开了一种跑题作文确定方法及装置。一种跑题作文确定方法,可以包括以下步骤:获得目标题目下的作文集合;根据作文集合中作文之间的文本相似度,确定作文集合的文档发散度;根据文档发散度,确定相似度阈值;针对作文集合中的每一篇作文,计算该作文与预先确定的目标题目的范文的文本相似度,如果该作文与范文的文本相似度小于相似度阈值,则确定该篇作文为跑题作文。应用本发明实施例所提供的技术方案,可以快速有效地确定出作文集合中的跑题作文,为作文自动评分系统提供有效参考,提高作文评分的准确率。