一种基于多因子混合排序机制的学科分类自动标引方法

    公开(公告)号:CN110990376A

    公开(公告)日:2020-04-10

    申请号:CN201911140195.9

    申请日:2019-11-20

    Abstract: 本发明提出一种基于多因子混合排序机制的学科分类自动标引方法,其特征在于:包含以下步骤:1.构建不同数据来源的基础语料库,获取每一个关键词在基础语料库中在对应的所有学科分类号下出现次数、最大次数及概率;2.根据待标引的文献选取相应的基础语料库,预处理待标引文献的关键词,通过对比待标引文献的关键词与基础语料库关键词,对命中的参数依据多因子混合排序机制测算分值并降序排列;3.基于权威文献分类法设计学科滤镜,并通过学科滤镜对步骤2中降序排列的学科分类号进行筛选,缩小学科范围,输出指定Top N个学科分类号;4.将输出的关键词及学科分类号入库基础语料库,进行合并或者修订,提升基础语料库规模和质量。

    一种基于多因子混合排序机制的学科分类自动标引方法

    公开(公告)号:CN110990376B

    公开(公告)日:2023-05-09

    申请号:CN201911140195.9

    申请日:2019-11-20

    Abstract: 本发明提出一种基于多因子混合排序机制的学科分类自动标引方法,其特征在于:包含以下步骤:1.构建不同数据来源的基础语料库,获取每一个关键词在基础语料库中在对应的所有学科分类号下出现次数、最大次数及概率;2.根据待标引的文献选取相应的基础语料库,预处理待标引文献的关键词,通过对比待标引文献的关键词与基础语料库关键词,对命中的参数依据多因子混合排序机制测算分值并降序排列;3.基于权威文献分类法设计学科滤镜,并通过学科滤镜对步骤2中降序排列的学科分类号进行筛选,缩小学科范围,输出指定Top N个学科分类号;4.将输出的关键词及学科分类号入库基础语料库,进行合并或者修订,提升基础语料库规模和质量。

Patent Agency Ranking