一种合同文本冗余数据的清理方法及装置
摘要:
本申请公开了一种合同文本冗余数据的清理方法及装置,首先对待处理的合同文本进行分词、去除停用词得到文本数据集,其次采用关键信息提取技术提取文本数据集中包括客户信息和合同条款的关键信息,最后通过朴素贝叶斯算法根据关键信息对待处理的合同文本进行冗余数据清理,通过清理合同文本中的冗余、无效和不相关数据,解决人工审核带来的耗费时间以及浪费人力的问题,同时提高文本处理效率和准确性,降低合同信息冗余处理成本和风险。
0/0