-
公开(公告)号:CN117475155B
公开(公告)日:2024-04-02
申请号:CN202311797890.9
申请日:2023-12-26
申请人: 厦门瑞为信息技术有限公司 , 厦门理工学院
IPC分类号: G06V10/26 , G06V20/13 , G06V20/17 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/084 , G06N3/0895
摘要: 本发明公开基于半监督学习的轻量级遥感图像分割方法,包括S1、收集原始图像数据集,标注部分数据集以得到部分标注的训练数据集;S2、构建两个完全一致的语义分割模型;S3、将无标签数据同时输入两个语义分割模型,计算输出的一致性损失;S4、将有标签数据同时输入两个语义分割模型,计算交叉熵损失和骰子损失的混合损失作为有监督损失;S5、总损失为一致性损失和两个模型的混合损失三者按权重相加;S6、对总体损失进行优化和反向梯度传播,更新网络参数;S7、在同一测试集分别测试训练好的两个模型,选择其中精度较高的一个模型作为最终模型。本发明可提高遥感图像分割的效率,在较低的参数量和计算复杂度下实现了更高的精度。
-
公开(公告)号:CN117475519B
公开(公告)日:2024-03-12
申请号:CN202311797195.2
申请日:2023-12-26
申请人: 厦门理工学院 , 厦门瑞为信息技术有限公司
摘要: 本发明公开了基于孪生网络与多重通道融合的脱机笔迹鉴别方法,将两张输入的笔迹图片进行取反操作,获取其反灰度图片,包括参考图片、测试图片、参考图片的反灰度图片、测试图片的反灰度图片四张笔迹图片;将四张笔迹图片分别进入同一个网络模型提取图像特征向量#imgabs0#,生成相应的四个特征向量;特征向量#imgabs1#经过两次双重笔迹注意力,进行权重加权处理,得到特征向量Y;将四张笔迹图片经过图像处理的128维图片进行融合,融合有512维图片;将融合后的图片经过自注意力与卷积操作,进行判断;将输出的特征向量进行sigmoid操作,将其作为置信度用来判断两张输入图片是否为同一个人书写。
-
公开(公告)号:CN117475519A
公开(公告)日:2024-01-30
申请号:CN202311797195.2
申请日:2023-12-26
申请人: 厦门理工学院 , 厦门瑞为信息技术有限公司
摘要: 本发明公开了基于孪生网络与多重通道融合的脱机笔迹鉴别方法,将两张输入的笔迹图片进行取反操作,获取其反灰度图片,包括参考图片、测试图片、参考图片的反灰度图片、测试图片的反灰度图片四张笔迹图片;将四张笔迹图片分别进入同一个网络模型提取图像特征向量 ,生成相应的四个特征向量;特征向量经过两次双重笔迹注意力,进行权重加权处理,得到特征向量Y;将四张笔迹图片经过图像处理的128维图片进行融合,融合有512维图片;将融合后的图片经过自注意力与卷积操作,进行判断;将输出的特征向量进行sigmoid操作,将其作为置信度用来判断两张输入图片是否为同一个人书写。
-
公开(公告)号:CN117475155A
公开(公告)日:2024-01-30
申请号:CN202311797890.9
申请日:2023-12-26
申请人: 厦门瑞为信息技术有限公司 , 厦门理工学院
IPC分类号: G06V10/26 , G06V20/13 , G06V20/17 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/048 , G06N3/084 , G06N3/0895
摘要: 本发明公开基于半监督学习的轻量级遥感图像分割方法,包括S1、收集原始图像数据集,标注部分数据集以得到部分标注的训练数据集;S2、构建两个完全一致的语义分割模型;S3、将无标签数据同时输入两个语义分割模型,计算输出的一致性损失;S4、将有标签数据同时输入两个语义分割模型,计算交叉熵损失和骰子损失的混合损失作为有监督损失;S5、总损失为一致性损失和两个模型的混合损失三者按权重相加;S6、对总体损失进行优化和反向梯度传播,更新网络参数;S7、在同一测试集分别测试训练好的两个模型,选择其中精度较高的一个模型作为最终模型。本发明可提高遥感图像分割的效率,在较低的参数量和计算复杂度下实现了更高的精度。
-
公开(公告)号:CN117218681A
公开(公告)日:2023-12-12
申请号:CN202311486914.9
申请日:2023-11-09
申请人: 厦门瑞为信息技术有限公司
摘要: 本发明公开了一种单目镜头的身高估计方法及小孩过闸装置与判断方法,通过对单目RGB镜头的安装做一些特定的限制和要求,利用几何关系即可直接算出目标行人的身高,且精度非常高,丝毫不差于带深度镜头的模组。本发明在闸机的出入口处设计了一个单目RGB镜头,利用该单目RGB镜头运行目标检测和多目标跟踪算法,其所需要的计算资源相较于双目镜头更少,对硬件的要求也更低,在原有闸机的基础上,以更小的成本、更简单的方案,更准确和更实用的效果,实现过闸小孩的智能识别,确保小孩安全、便利地通过,并提高整个闸机通行的效率和用户体验。
-
公开(公告)号:CN117218681B
公开(公告)日:2024-02-06
申请号:CN202311486914.9
申请日:2023-11-09
申请人: 厦门瑞为信息技术有限公司
摘要: 本发明公开了一种单目镜头的身高估计方法及小孩过闸装置与判断方法,通过对单目RGB镜头的安装做一些特定的限制和要求,利用几何关系即可直接算出目标行人的身高,且精度非常高,丝毫不差于带深度镜头的模组。本发明在闸机的出入口处设计了一个单目RGB镜头,利用该单目RGB镜头运行目标检测和多目标跟踪算法,其所需要的计算资源相较于双目镜头更少,对硬件的要求也更低,在原有闸机的基础上,以更小的成本、更简单的方案,更准确和更实用的效果,实现过闸小孩的智能识别,确保小孩安全、便利地通过,并提高整个闸机通行的效率和用户体验。
-
公开(公告)号:CN116758591A
公开(公告)日:2023-09-15
申请号:CN202311044432.8
申请日:2023-08-18
申请人: 厦门瑞为信息技术有限公司
摘要: 本发明公开了一种基于图像语义识别的场站特殊旅客识别和交互系统及方法,系统包括:图像采集终端、图像语义模型训练服务器、图像识别终端及交互终端,图像采集终端设有图像采集模块,图像语义模型训练服务器设有通用图像语义识别大模型及特殊旅客数据集,图像识别终端设有图像语义识别模块,交互终端设有服务人员提示模块、服务人员确认模块及特殊旅客关怀交互模块;本发明采用人工智能辅助服务人员的方式,从“发现”到“确认”到“帮服措施”,形成一整套完整的识别和交互系统,采用语义图像分析识别技术,对通用图像语义识别大模型进行微调训练,可适应复杂的场景和各式各样人的特征,具有较高的鲁棒性和准确性,可提高特殊旅客的发现效率。
-
公开(公告)号:CN117935155A
公开(公告)日:2024-04-26
申请号:CN202410095700.7
申请日:2024-01-23
申请人: 厦门瑞为信息技术有限公司
摘要: 本申请的实施例提供了一种人流拥堵识别处理方法、装置、计算机可读介质及设备。该方法包括:获取针对目标区域的监控视频流;依次对监控视频流中各视频帧进行行人检测,确定每一视频帧中与其所包含的行人对应的行人框及其属性信息;在每一次行人检测后,根据当前视频帧中各行人框的属性信息与基于在先视频帧所确定的各行人轨迹进行匹配,并根据匹配结果,对各行人轨迹进行轨迹更新;根据轨迹更新后的各行人轨迹,确定当前视频帧中在目标区域内的滞留人数;根据滞留人数,确定当前视频帧中目标区域是否存在人流拥堵,并执行对应的人流管控策略。本申请实施例的技术方案可以提高人流拥堵识别的准确率,并在人流拥堵时进行快速且有效的响应。
-
公开(公告)号:CN117036911A
公开(公告)日:2023-11-10
申请号:CN202311301590.7
申请日:2023-10-10
申请人: 华侨大学 , 星宸科技股份有限公司 , 厦门瑞为信息技术有限公司
IPC分类号: G06V10/82 , G06N3/0464 , G06N3/08 , G06V10/74
摘要: 本发明公开了一种基于神经架构搜索的车辆再辨识轻量化方法及系统,涉及计算机视觉与机器学习技术领域,方法包括:S1,构建网络模型,给定硬件约束以生成对应的架构生成器,利用测试集训练架构生成器;S2,将硬件约束输入到架构生成器,得到多个轻量化神经网络架构模型;S3,采集车辆再辨识数据并进行数据增强;S4,利用车辆再辨识数据集对轻量化神经网络架构模型进行训练及验证,选择效果最好的作为轻量化车辆再辨识网络;S5,基于轻量化车辆再辨识网络进行车辆再辨识。本发明利用神经架构搜索自适应地依据硬件约束进行神经网络的搭建,得到兼具效率与性能的轻量化网络,可以在大规模的神经网络设计中减轻人工设计和调试的负担。
-
公开(公告)号:CN118675216A
公开(公告)日:2024-09-20
申请号:CN202411171785.9
申请日:2024-08-26
申请人: 厦门瑞为信息技术有限公司
IPC分类号: G06V40/16 , G06V40/40 , G06V10/764 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06V10/80
摘要: 本发明公开了一种基于Transformer的人脸活体检测方法,其包括:获取原始人脸图片,并对所述原始人脸图片进行人脸检测和特征点定位,得到人脸特征点信息,并根据所述特征点信息构造对应不同人脸目标位置的多张训练图像;将所述训练图像输入包括Transformer主干网络、多任务分支模块以及FC,所述训练图像包括人脸图像、人眼位置图像、鼻子位置图像、嘴巴位置图像以及耳朵位置图像分类模块所构建的模型中并基于预设损失函数进行训练,得到活体检测模型;通过单目摄像头采集待检测人脸图像并输入至所述活体检测模型中,得到识别结果,根据识别结果判断所述待检测人脸图像是否是活体。能够有效区分真实人脸与各种高仿真度的假体攻击,提升活体检测的准确性。
-
-
-
-
-
-
-
-
-