-
公开(公告)号:CN111930946A
公开(公告)日:2020-11-13
申请号:CN202010832816.6
申请日:2020-08-18
Applicant: 哈尔滨工程大学
IPC: G06F16/35 , G06K9/62 , G06F40/205
Abstract: 一种基于相似性度量的专利分类方法,它属于文本分类技术领域。本发明解决了采用现有的专利分类方法对专利分类的准确率低的问题。本发明考虑专利说明书摘要的特征,将CHI统计量和余弦相似度相结合后,再结合IPC分类号的相似性,提出一种基于混合相似度的专利分类方法。针对权利要求书,提出一种基于权利要求书相似度的专利分类方法。根据抽取出来的SAO-x多维结构,计算权利要求书相似度,基于相似度结果采用KNN分类算法对专利进行分类。与现有的专利分类方法相比,本发明进行专利自动分类的准确率达到70%以上,降低了人工分类在主观层面上产生的分类误差。本发明可以应用于文本分类技术领域。