发明公开
CN117082178A 基于机器学习的多页扫描
审中-实审
- 专利标题: 基于机器学习的多页扫描
-
申请号: CN202310174551.9申请日: 2023-02-28
-
公开(公告)号: CN117082178A公开(公告)日: 2023-11-17
- 发明人: 孙彤 , N·S·雷夫科夫斯基 , N·利普卡 , J·A·希利 , C·M·威灵顿 , A·马利克
- 申请人: 奥多比公司
- 申请人地址: 美国加利福尼亚州
- 专利权人: 奥多比公司
- 当前专利权人: 奥多比公司
- 当前专利权人地址: 美国加利福尼亚州
- 代理机构: 北京市金杜律师事务所
- 代理商 张维
- 优先权: 17/663,785 20220517 US
- 主分类号: H04N1/00
- IPC分类号: H04N1/00 ; H04N1/10 ; G06F18/214 ; G06F18/24
摘要:
提供了用于基于机器学习的多页扫描的系统和方法。在一个实施例中,一个或多个处理设备执行操作,该操作包括:接收视频流,该视频流包括图像帧,图像帧捕获文档的多个页面。该操作还包括:经由机器学习模型检测新页面事件,该机器学习模型经训练以从视频流检测推断事件。新页面事件的检测指示多个页面中的可用于扫描的页面已从第一页面改变为第二页面。基于对新页面事件的检测,一个或多个处理设备从视频流捕获页面的图像帧。在一些实施例中,机器学习模型基于视频数据、惯性数据、音频样本、图像深度信息、图像统计、和/或其它信息的加权使用来检测事件。