发明授权
- 专利标题: 文档数字化中的语义规范化
-
申请号: CN201880069289.9申请日: 2018-11-30
-
公开(公告)号: CN111263943B公开(公告)日: 2023-10-10
- 发明人: K·诺思罗普 , C·特里姆 , T·希克凯 , A·阿德尼兰 , K·诺思罗普
- 申请人: 国际商业机器公司
- 申请人地址: 美国纽约阿芒克
- 专利权人: 国际商业机器公司
- 当前专利权人: 国际商业机器公司
- 当前专利权人地址: 美国纽约阿芒克
- 代理机构: 北京市金杜律师事务所
- 代理商 酆迅; 姚杰
- 国际申请: PCT/IB2018/059490 2018.11.30
- 国际公布: WO2019/106613 EN 2019.06.06
- 进入国家日期: 2020-04-23
- 主分类号: G06F40/30
- IPC分类号: G06F40/30
摘要:
一种用于规范化文档图像中的键的方法,包括:基于候选键在语义上与键可互换,识别与文档图像中的对象相对应的候选键为键本体数据中的键。文档图像的每个对象的上下文、位置和样式在文档元数据中表示。将候选键规范化为规范化形式。确定对应于规范化形式的键类,并且评估指示该键类代表候选键的可能性的置信度分数。在验证时用键类更新语义数据库,以增强对未来文档的处理。
公开/授权文献
- CN111263943A 文档数字化中的语义规范化 公开/授权日:2020-06-09