-
公开(公告)号:CN116702739A
公开(公告)日:2023-09-05
申请号:CN202310672681.5
申请日:2023-06-07
申请人: 中铁八局集团建筑工程有限公司 , 西南民族大学 , 中铁八局集团有限公司
IPC分类号: G06F40/194 , G06F40/169 , G06F40/186 , G06F40/117 , G06F40/216 , G06F40/30 , G06F16/35
摘要: 本申请公开了一种合同文本错误信息的模糊判定方法及装置,首先基于Python‑docx库的二次封装对合同文本进行读写得到多个段落,再将差异比较处理多个段落与合同文本模板中的段落进行对比,计算段落余弦相似度,然后使用差异比较算法按照差异比较处理段落余弦相似度对差异比较处理多个段落与合同文本模板中的段落进行差异比较处理得到文本差异内容和文本差异位置,最后根据差异比较处理文本差异内容和文本差异位置对差异比较处理合同文本进行修改。通过计算文本之间的余弦相似度,配合差异比较算法进行自动文本比对,对审核结果进行自动批注,具有识别准确、速度快、效率高的优点,还能够提供直观和准确的审核结果,减少审核结果的误解和误判的可能性。
-
公开(公告)号:CN116680362A
公开(公告)日:2023-09-01
申请号:CN202310696849.6
申请日:2023-06-13
申请人: 中铁八局集团建筑工程有限公司 , 西南民族大学 , 中铁八局集团有限公司
IPC分类号: G06F16/33 , G06F16/35 , G06N3/0455 , G06N3/08 , G06Q50/18 , G06F40/289 , G06F40/216
摘要: 本申请公开了一种合同文本冗余数据的清理方法及装置,首先对待处理的合同文本进行分词、去除停用词得到文本数据集,其次采用关键信息提取技术提取文本数据集中包括客户信息和合同条款的关键信息,最后通过朴素贝叶斯算法根据关键信息对待处理的合同文本进行冗余数据清理,通过清理合同文本中的冗余、无效和不相关数据,解决人工审核带来的耗费时间以及浪费人力的问题,同时提高文本处理效率和准确性,降低合同信息冗余处理成本和风险。
-