-
公开(公告)号:CN115695670A
公开(公告)日:2023-02-03
申请号:CN202211282113.6
申请日:2022-10-19
申请人: 网易有道信息技术(北京)有限公司
摘要: 本发明的实施方式提供了一种用于便携式扫描设备多行扫描的方法及相关产品。其中,所述方法包括:获取所述便携式扫描设备扫描到的图像,其中所述图像包括多行字符信息;从所述图像中获取所述多行字符信息以及关于所述多行字符信息的段落结构信息;以及基于所述多行字符信息和所述段落结构信息,确定所述图像的多行扫描结果。通过本发明的技术方案,能够支持多行扫描操作,有效提高扫描效率,从而提升便携式扫描设备的整体性能。
-
公开(公告)号:CN115147623A
公开(公告)日:2022-10-04
申请号:CN202210667286.3
申请日:2022-06-13
申请人: 网易有道信息技术(北京)有限公司
摘要: 本公开提供一种目标图像的获取方法及相关设备。该方法包括:逐帧获取关于所述目标图像的多个图像帧;其中,所述图像帧包括所述目标图像的部分图像;分割步骤:基于n个不同预设尺寸中的第i预设尺寸对当前图像帧进行分割,得到第i尺寸图像;其中,i为大于等于1且小于等于n的整数,n为正整数;匹配步骤:将所述第i尺寸图像与所述当前图像帧的前一图像帧进行图像匹配,得到所述第i尺寸图像与所述前一图像帧的第i匹配度和所述第i尺寸图像在所述前一图像帧中的第i偏移量;融合步骤:响应于所述第i匹配度处于预设范围,基于所述第i偏移量将所述当前图像帧与所述前一图像帧融合。
-
公开(公告)号:CN115981488A
公开(公告)日:2023-04-18
申请号:CN202211535229.6
申请日:2022-11-30
申请人: 网易有道信息技术(北京)有限公司
IPC分类号: G06F3/0346 , G06F3/038
摘要: 本申请的实施方式提供了一种模式切换方法、装置、电子设备及存储介质。该模式切换方法包括:获取加速度数据;根据加速度数据确定当前设备的设备状态,设备状态包括摇晃状态以及稳定状态;若设备状态为摇晃状态,则生成模式切换指令;响应于模式切换指令,将当前运行模式切换为目标运行模式。本申请的方法能够避免用户需要跳出使用进程来进行模式切换而导致用户的工作进度受影响的情况,降低用户的操作成本,提升用户的使用体验感。
-
公开(公告)号:CN113255653A
公开(公告)日:2021-08-13
申请号:CN202011379944.6
申请日:2020-11-30
申请人: 网易有道信息技术(北京)有限公司
IPC分类号: G06K9/22 , G06K9/20 , G06K9/00 , G06F40/58 , G06F40/126
摘要: 本发明的实施方式提供了一种用于便携式扫描设备的方法和便携式扫描设备。该方法包括:识别经由所述便携式扫描设备采集的图像;以及根据所述识别的图像包括的内容,控制所述便携式扫描设备自动地进入相应的功能模式。通过本发明实施方式的方法,可以实现便携式扫描设备的多功能之间的自动执行或切换,而无需手动操作或控制,从而减少了操作次数和复杂程度,为用户带来了更好的体验。
-
公开(公告)号:CN116386057A
公开(公告)日:2023-07-04
申请号:CN202211714145.9
申请日:2022-12-29
申请人: 网易有道信息技术(北京)有限公司
IPC分类号: G06V30/19 , G06N3/0455 , G06N3/0464 , G06N3/047 , G06N3/08
摘要: 本发明的实施方式提供了一种用于识别文字的方法及相关产品。其中,所述方法包括:获取待识别的单行文本图像,其中所述单行文本图像中包括一种或多种语种文字;以及基于推理阶段的文字识别模型对所述单行文本图像进行处理,其中训练阶段和推理阶段的文字识别模型采用不同的网络结构,且推理阶段的文字识别模型是经由训练阶段训练好的文字识别模型轻量化处理得到的;以及基于所述推理阶段的文本识别模型的输出,确定所述单行文本图像中所有语种文字的识别结果。通过本发明的技术方案,可以结合轻量化的文字识别模型实现对多语种文字的识别,整个识别过程无需显式区分目标语种,可以大幅提高文字识别效率。
-
公开(公告)号:CN115761761A
公开(公告)日:2023-03-07
申请号:CN202211535578.8
申请日:2022-11-30
申请人: 网易有道信息技术(北京)有限公司
IPC分类号: G06V30/19 , G06V30/14 , G06V30/146 , G06V30/18
摘要: 本发明的实施方式提供了一种文本识别方法、装置、电子设备及存储介质。该方法包括:对拼图图像进行段落检测,获取至少一个目标图像;目标图像携带段落信息,不同的目标图像对应的段落信息不同;对目标图像进行检测切行,获取段落信息对应的文本行;对所有文本行进行文字识别,得到每个文本行对应的目标文字识别结果,所有目标文字识别结果的集合作为拼图图像的识别结果;目标文字识别结果携带段落信息。本方法通过对拼图图像进行段落检测,获取目标图像和目标图像的段落信息,使得文字识别结果携带段落信息,可提供带有段落层级结构的识别结果,为用户带来了更好的体验。此外,本发明的实施方式提供了一种文本识别装置、电子设备及存储介质。
-
公开(公告)号:CN112347228A
公开(公告)日:2021-02-09
申请号:CN202011257882.1
申请日:2020-11-10
申请人: 网易有道信息技术(北京)有限公司
摘要: 本发明的实施方式提供了一种用于文本查询的方法和便携式电子设备,其中所述方法包括:识别经由便携式电子设备在扫描介质上的一个位置点处采集的图像;以及根据识别出的所述图像中包括的源文本,确定与所述源文本匹配的一个或多个目标文本。根据本发明实施方式的用于文本查询的方法和便携式电子设备,可以实现仅通过一个位置点的图像来查询文本的目的,有利于减少用户操作以及提高查词速率。
-
公开(公告)号:CN111612696A
公开(公告)日:2020-09-01
申请号:CN202010436479.9
申请日:2020-05-21
申请人: 网易有道信息技术(北京)有限公司
摘要: 本发明的实施例提供了一种图像拼接方法、装置、介质及电子设备,涉及图像处理技术领域。该方法包括:获取当前全景图像,其中,所述当前全景图像包括当前帧图像;获取实时扫描采集的后续输入帧图像,并计算所述后续输入帧图像与所述当前帧图像对应的最佳匹配偏移距离;根据所述最佳匹配偏移距离将所述后续输入帧图像拼接到所述当前全景图像中,并通过拼接完成的当前全景图像更新所述当前全景图像以及通过所述后续输入帧图像更新所述当前帧图像。本发明实施例的技术方案能够在快速实现图像片段拼接的同时,保证拼接得到的全景图像的准确率较高,效果较好,并且提升图像拼接的效率。
-
公开(公告)号:CN111612696B
公开(公告)日:2024-04-02
申请号:CN202010436479.9
申请日:2020-05-21
申请人: 网易有道信息技术(北京)有限公司
IPC分类号: G06T3/4038 , G06T5/50 , G06T7/11 , G06T7/136 , G06T7/33
摘要: 本发明的实施例提供了一种图像拼接方法、装置、介质及电子设备,涉及图像处理技术领域。该方法包括:获取当前全景图像,其中,所述当前全景图像包括当前帧图像;获取实时扫描采集的后续输入帧图像,并计算所述后续输入帧图像与所述当前帧图像对应的最佳匹配偏移距离;根据所述最佳匹配偏移距离将所述后续输入帧图像拼接到所述当前全景图像中,并通过拼接完成的当前全景图像更新所述当前全景图像以及通过所述后续输入帧图像更新所述当前帧图像。本发明实施例的技术方案能够在快速实现图像片段拼接的同时,保证拼接得到的全景图像的准确率较高,效果较好,并且提升图像拼接的效率。
-
公开(公告)号:CN114743208A
公开(公告)日:2022-07-12
申请号:CN202210348810.0
申请日:2022-04-01
申请人: 网易有道信息技术(北京)有限公司
IPC分类号: G06V30/413 , G06V30/148 , G06V10/764 , G06V10/82 , G06V30/19 , G06K9/62 , G06N3/04 , G06N3/08
摘要: 本发明的实施方式提供了一种图像处理模型的训练方法及其相关产品。所述图像处理模型包括识别模型,所述训练方法包括:获取训练图片,其中所述训练图片包括已标注的纯文本图片、纯公式图片和文本公式混排图片,所述标注包括根据适用于公式和文本的分词规则的分词;将所述训练图片输入到所述识别模型进行训练,以得到输出结果;根据所述训练图片中的所述标注和所述输出结果计算损失函数,以在反向传播中更新所述识别模型的参数。本发明的实施方式仅使用了一个模型,降低了资源消耗,提高了识别质量。此外,还提供了使用图像处理模型进行图像处理的方法,以及一种计算装置和计算机可读存储介质。
-
-
-
-
-
-
-
-
-