一种显著显示文档文字内容差异的方法及系统
摘要:
本发明提出一种显著显示文档文字内容差异的方法及系统,属于人工智能技术领域,包括:获取两个待比较文档,并导出为PDF;输出并保存每页的文本行文字内容,将得到的文本行文字内容按规则去除指定标点符号,按文本行的坐标整理成正常阅读顺序,拼接在一起,最终两个待比较文档各得到一个长字符串,一共两个长字符串;利用寻找字符串差异的算法处理两个长字符串,得到字符串差异信息,将差异信息重新整理,得到每个字符串的差异列表;根据差异列表生成含有差异区域填充的每页文档的图片;通过本发明中的显著显示文档文字内容差异的方法,用户可以快速、直观地比较并两个文档文字内容的差异,提高了办公效率。
0/0