发明公开
- 专利标题: 使用来自正交行和列的全局机器学习特征的表头部检测
-
申请号: CN201910886265.9申请日: 2019-09-19
-
公开(公告)号: CN110928871A公开(公告)日: 2020-03-27
- 发明人: H·纳迪姆 , A·R·弗里德 , J·S·艾伦 , K·G·克里斯蒂森
- 申请人: 国际商业机器公司
- 申请人地址: 美国纽约
- 专利权人: 国际商业机器公司
- 当前专利权人: 国际商业机器公司
- 当前专利权人地址: 美国纽约
- 代理机构: 北京市中咨律师事务所
- 代理商 刘都; 于静
- 优先权: 16/136757 2018.09.20 US
- 主分类号: G06F16/22
- IPC分类号: G06F16/22 ; G06F16/28
摘要:
一种用于检测各种文档(例如PDF和HTML文件)中的头部的方法、系统和计算机可用介质。文件被转换为具有正交行和列的二维阵列或表。确定行或列包括头部。用于确定行是否包含头部。对于阵列或表中的每行,对与该行正交的每列的每个单元执行成对比较。对于该行的每个正交列,将成对比较得分或值求和,并且对于行的所有正交列的总和提供该行的得分或值。行得分相对于彼此而进行评估,以确定行中具有头部的可能性。为了确定列是否具有头部,在列及其正交行之间执行类似的计算。
公开/授权文献
- CN110928871B 使用来自正交行和列的全局机器学习特征的表头部检测 公开/授权日:2023-10-17