一种阅读交互装置、方法、计算机设备和阅读笔

    公开(公告)号:CN114611530A

    公开(公告)日:2022-06-10

    申请号:CN202210162374.8

    申请日:2022-02-22

    摘要: 本申请涉及一种阅读交互装置、方法、计算机设备和阅读笔,属于图像处理技术领域。装置包括图像采集模块和雾端连接模块;图像采集模块,用于获取包括目标文字区域的图像;雾端连接模块,用于和外接雾端建立连接,通过外接雾端中的学习软件对包括目标文字区域的图像进行相应的处理;其中,外接雾端为存储有学习软件的平台,学习软件为基于自然语言处理技术的算法模型。本申请通过与外接雾端建立连接,可以利用外接雾端中的学习软件对获取的包括目标文字区域的图像进行相应的处理,不占用阅读交互装置自身的资源。学习软件为基于自然语言处理技术的算法模型,可具备不同的处理方式,使得本申请中阅读交互装置的应用场景更加丰富,用户体验感更好。

    一种视频处理系统、方法、装置、电子设备和存储介质

    公开(公告)号:CN114513681A

    公开(公告)日:2022-05-17

    申请号:CN202210088178.0

    申请日:2022-01-25

    IPC分类号: H04N21/231 H04N21/234

    摘要: 本申请涉及一种视频处理系统、方法、装置、电子设备和存储介质,属于软件监控技术领域。包括:边缘端中的前置服务单元用于获取应用场景设备端采集的初始视频数据,对初始视频数据进行目标对象识别操作,以提取包含目标对象的图像帧,并发送至算法服务单元;边缘端中的算法服务单元用于对于每帧包含目标对象的图像帧,根据该图像帧对应的当前应用场景,确定对应的对象提取模型,根据当前应用场景对应的对象提取模型提取图像帧中的目标对象,得到图像帧的目标数据;云端用于存储初始视频数据对应的目标数据。本申请具备高效率的图像处理能力,根据不同的应用场景加载不同的对象提取模型,并非一个应用场景对应一个视频处理系统,适用范围较广。

    一种高效的类手-文混合目标检测方法

    公开(公告)号:CN114359885A

    公开(公告)日:2022-04-15

    申请号:CN202111620882.8

    申请日:2021-12-28

    IPC分类号: G06V20/62 G06N3/04 G06N3/08

    摘要: 本发明提供了一种高效的类手‑文混合目标检测方法,通过设计的混合目标检测模型在已经具备手指、笔等类柱体物和目标文本的图像数据集进行训练,平衡地划分训练的正负样本,使深度网络模型只对图像中同时包含类手指指尖和文本字词的区域感兴趣,降低深度网络模型在图像其他区域所生成的预测框的置信度,从而在现实阅读场景中做到模型只对手指所指向的文本进行检测,而忽略当前页的其他文本字词,避免了对图像中手指、笔等类柱体物和文字的两次目标检测与坐标变换的过程,优化了检测的实时性,简化了检测的思路。