一种基于自然语言处理的投标文件查重方法及系统

    公开(公告)号:CN119203981A

    公开(公告)日:2024-12-27

    申请号:CN202411193822.6

    申请日:2024-08-28

    Abstract: 本发明公开了一种基于自然语言处理的投标文件查重方法及系统,涉及文本相似度计算技术领域,解决了在投标文件查重中,难以将文件内部的重复文字对投标文件之间查重结果的影响去除,以及忽视了同一种意思用不同的表达方式带来的查重率降低的技术问题;本发明通过将各投标文件的文本内容转换为非文本语言的设定语言,基于各投标文件的文本语言为各投标文件进行内部查重得到内部重复率,基于各投标文件的文本语言与设定语言为各投标文件进行外部查重得到外部重复率;将内部重复率和外部重复率进行综合得到重复因子,基于重复因子输出查重结果;本发明能够提高两个投标文件之间相似度计算的准确性,保障了招投标秩序和市场经济秩序。

Patent Agency Ranking