发明公开
- 专利标题: 一种显著显示文档文字内容差异的方法及系统
-
申请号: CN202410611942.7申请日: 2024-05-17
-
公开(公告)号: CN118194843A公开(公告)日: 2024-06-14
- 发明人: 葛君正 , 李锐 , 宁方刚 , 陈其宾 , 姜凯
- 申请人: 山东浪潮科学研究院有限公司
- 申请人地址: 山东省济南市高新区浪潮路1036号s02楼
- 专利权人: 山东浪潮科学研究院有限公司
- 当前专利权人: 山东浪潮科学研究院有限公司
- 当前专利权人地址: 山东省济南市高新区浪潮路1036号s02楼
- 代理机构: 济南尚本知识产权代理事务所
- 代理商 杨宝根
- 主分类号: G06F40/194
- IPC分类号: G06F40/194 ; G06V30/14
摘要:
本发明提出一种显著显示文档文字内容差异的方法及系统,属于人工智能技术领域,包括:获取两个待比较文档,并导出为PDF;输出并保存每页的文本行文字内容,将得到的文本行文字内容按规则去除指定标点符号,按文本行的坐标整理成正常阅读顺序,拼接在一起,最终两个待比较文档各得到一个长字符串,一共两个长字符串;利用寻找字符串差异的算法处理两个长字符串,得到字符串差异信息,将差异信息重新整理,得到每个字符串的差异列表;根据差异列表生成含有差异区域填充的每页文档的图片;通过本发明中的显著显示文档文字内容差异的方法,用户可以快速、直观地比较并两个文档文字内容的差异,提高了办公效率。