-
公开(公告)号:CN114219742A
公开(公告)日:2022-03-22
申请号:CN202111055117.6
申请日:2021-09-09
申请人: 武汉工程大学 , 武汉逸锦科技有限公司
摘要: 本发明提供了一种联合流形约束和FB‑GAN的人脸变形方法和系统,通过使用生成对抗神经网络设计出端到端的人脸图像拼接对抗网络FB‑GAN,实现了在人脸变形过程中生成高分辨率的人脸图像的功能。本发明通过人脸变形算法生成高分辨率的人脸图像,解决了传统变形中人脸嘴巴从闭合到张开所导致的嘴巴“扭曲”或“空洞”问题。本发明解决了人脸拼接问题中的颜色差异较大而导致的拼接效果较差的问题,提高了人脸生成图像的真实性。
-
公开(公告)号:CN114611530A
公开(公告)日:2022-06-10
申请号:CN202210162374.8
申请日:2022-02-22
申请人: 武汉工程大学 , 武汉逸锦科技有限公司
IPC分类号: G06F40/56 , G06F40/242 , G06F16/33 , G06V30/142 , G06V30/413 , G06V10/82
摘要: 本申请涉及一种阅读交互装置、方法、计算机设备和阅读笔,属于图像处理技术领域。装置包括图像采集模块和雾端连接模块;图像采集模块,用于获取包括目标文字区域的图像;雾端连接模块,用于和外接雾端建立连接,通过外接雾端中的学习软件对包括目标文字区域的图像进行相应的处理;其中,外接雾端为存储有学习软件的平台,学习软件为基于自然语言处理技术的算法模型。本申请通过与外接雾端建立连接,可以利用外接雾端中的学习软件对获取的包括目标文字区域的图像进行相应的处理,不占用阅读交互装置自身的资源。学习软件为基于自然语言处理技术的算法模型,可具备不同的处理方式,使得本申请中阅读交互装置的应用场景更加丰富,用户体验感更好。
-
公开(公告)号:CN114513681A
公开(公告)日:2022-05-17
申请号:CN202210088178.0
申请日:2022-01-25
申请人: 武汉工程大学 , 武汉逸锦科技有限公司
IPC分类号: H04N21/231 , H04N21/234
摘要: 本申请涉及一种视频处理系统、方法、装置、电子设备和存储介质,属于软件监控技术领域。包括:边缘端中的前置服务单元用于获取应用场景设备端采集的初始视频数据,对初始视频数据进行目标对象识别操作,以提取包含目标对象的图像帧,并发送至算法服务单元;边缘端中的算法服务单元用于对于每帧包含目标对象的图像帧,根据该图像帧对应的当前应用场景,确定对应的对象提取模型,根据当前应用场景对应的对象提取模型提取图像帧中的目标对象,得到图像帧的目标数据;云端用于存储初始视频数据对应的目标数据。本申请具备高效率的图像处理能力,根据不同的应用场景加载不同的对象提取模型,并非一个应用场景对应一个视频处理系统,适用范围较广。
-
公开(公告)号:CN117218641A
公开(公告)日:2023-12-12
申请号:CN202311235672.6
申请日:2023-09-25
申请人: 武汉逸锦科技有限公司 , 武汉工程大学
IPC分类号: G06V20/62 , G06V10/26 , G06V10/25 , G06V10/40 , G06V10/80 , G06V10/764 , G06V10/82 , G06N3/0464 , G06N3/0455 , G06N3/09
摘要: 本发明公开了一种密集场景文本检测与识别方法,包括:获取公共数据集以及密集文本图像数据集;建立基于词长感知Transformer的深度学习网络模型,采用所述公共数据集对所述深度学习网络模型进行预训练,以生成初始识别模型;采用所述密集文本图像数据集对所述初始识别模型进行训练,以优化所述初始识别模型后,生成密集场景文本检测和识别协同模型;获取待识别密集场景文本图像,将所述待识别密集场景文本图像输入至所述密集场景文本检测和识别协同模型中,以得到识别结果。本发明解决了现有技术中密集场景文本检测与识别方法准确度低、容易出现漏检误检的技术问题。
-
公开(公告)号:CN114359885A
公开(公告)日:2022-04-15
申请号:CN202111620882.8
申请日:2021-12-28
申请人: 武汉工程大学 , 武汉逸锦科技有限公司
摘要: 本发明提供了一种高效的类手‑文混合目标检测方法,通过设计的混合目标检测模型在已经具备手指、笔等类柱体物和目标文本的图像数据集进行训练,平衡地划分训练的正负样本,使深度网络模型只对图像中同时包含类手指指尖和文本字词的区域感兴趣,降低深度网络模型在图像其他区域所生成的预测框的置信度,从而在现实阅读场景中做到模型只对手指所指向的文本进行检测,而忽略当前页的其他文本字词,避免了对图像中手指、笔等类柱体物和文字的两次目标检测与坐标变换的过程,优化了检测的实时性,简化了检测的思路。
-
-
-
-