-
公开(公告)号:CN115862130A
公开(公告)日:2023-03-28
申请号:CN202211433342.3
申请日:2022-11-16
Applicant: 之江实验室
IPC: G06V40/20 , G06V40/10 , G06V10/40 , G06V10/764 , G06V10/774 , G06V20/52 , G06V10/82 , G06V20/40 , G06N3/0464 , G06N3/047 , G06N3/084
Abstract: 基于人体姿态及其躯干运动场的行为识别方法,包括:获取多人人体彩色图像作为输入;采用目标检测网络从所述多人人体彩色图像中检测二维人体包围框,采用二维人体姿态估计网络从截取的图像中计算二维人体姿态;基于二维人体姿态分别计算关键点热图和躯干运动场,拼接这两种模态作为人体姿态表征;将人体姿态表征作为输入,建立姿态网络用于提取人体行为特征,输出分类器中概率最大的行为类别;采集多人人体彩色图像序列、二维人体姿态以及对应的类别标签作为训练数据集,采用随机梯度下降的优化方法对姿态网络进行预训练优化。本发明减少了复杂背景下行为动作在时间序列的歧义性,提高了低采样帧率下的行为识别的准确率。
-
公开(公告)号:CN115857550A
公开(公告)日:2023-03-28
申请号:CN202211514011.2
申请日:2022-11-29
Applicant: 之江实验室
IPC: G05D1/10
Abstract: 本发明公开了一种面向eVTOL空中旅游观光的轨迹规划方法,包括:对某一景点的地形、空域信息进行建模,获得用于路径规划的地图;根据观光需求,设置eVTOL飞行器需要途经的关键路径点序列;采用路径规划算法找到一条连接所有关键路径点的最短且无碰撞的路径;以生成的路径为中心,向外扩展生成一个安全飞行走廊,所述安全飞行走廊内部无障碍物;在所述安全飞行走廊中采用深度强化学习算法进行仿真训练,获得能够完成飞行任务且消耗能量最少的轨迹,完成轨迹规划。本发明在轨迹规划过程中考虑安全性、经济性以及飞行器运动‑动力学,降低了空中旅游观光的风险,改善了乘客的乘坐体验,减少了飞行器的能耗,实现方法简单,适用于各种空中旅游观光场景。
-
公开(公告)号:CN115831145A
公开(公告)日:2023-03-21
申请号:CN202310123145.X
申请日:2023-02-16
Applicant: 之江实验室
IPC: G10L21/0232 , G10L21/0264 , G10L25/21
Abstract: 本发明公开一种双麦克风语音增强方法和系统,该方法包括:步骤一,对两个麦克风通道的信号进行分帧,加窗,快速傅里叶变换的操作,使得信号从时域转换到频域;步骤二,利用互相关函数对两个通道在频域的信号进行语音活跃检测,若检测为无语音段,则更新噪声互功率谱;若检测为有语音段,则对语音信号进行降噪处理;步骤三,使用降噪后的语音信号来估计晚期混响功率谱,并抑制混响,即使用晚期混响功率谱对降噪后的语音信号做去混响处理;步骤四,将降噪去混响后的信号从频域转换回时域后输出。本发明进行语音活跃检测、噪声互功率谱更新和噪声抑制,同时进行去混响处理,增加了混响抑制的有效性;结合降噪抑制和混响抑制,有效的提高了语音质量。
-
公开(公告)号:CN115827844A
公开(公告)日:2023-03-21
申请号:CN202211609811.2
申请日:2022-12-12
Applicant: 之江实验室
IPC: G06F16/332 , G06F16/36 , G06F40/295
Abstract: 一种基于Sparql语句生成的知识图谱问答方法,包括:将本体层的知识图谱和实例层的知识图谱映射到向量空间,学习每个概念、实体和关系的向量表示;通过命名实体识别算法识别出自然语言查询语句中的所有实体,并通过实体链接算法将问题中的实体链接到知识图谱实例层中的实体;在训练集中检索K个与查询问题相似的问题以及相应的Sparql语句;对问题和候选Sparql语句信息集进行编码,并采用多头注意力机制融合它们的信息;获取基于问题的本体编码,检索基于问题的本体子图以及相应的编码,并融合信息;采用transformer的Decoder部分作为生成模型,使用问题的编码、相应Sparql语句的编码以及本体子图的编码生成基于问题的Sparql语句;执行生成的Sparql语句,查询并返回问题的答案。
-
公开(公告)号:CN115805607A
公开(公告)日:2023-03-17
申请号:CN202211537972.5
申请日:2022-12-01
Applicant: 之江实验室
Abstract: 本申请涉及一种机械手和机器人。机械手包括掌部、机械指、掌部驱动结构以及关节结构。掌部包括掌平面和与掌平面垂直的掌侧面。机械指包括沿延伸方向排布的指尖、远端指段和近端指段。远端指段的一端与指尖转动连接。掌部驱动结构设置于掌侧面,与近端指段远离远端指段的一端连接,以在连接方向上连接机械指和掌部。掌部驱动结构用于驱动机械指的运动,以改变机械指和掌部之间的角度。连接方向垂直于掌侧面。远端指段远离指尖的一端与关节结构转动连接。近端指段远离掌部驱动结构的一端与关节结构转动连接。关节结构能够改变远端指段和近端指段指尖之间的角度。
-
公开(公告)号:CN113408428B
公开(公告)日:2023-03-14
申请号:CN202110690143.X
申请日:2021-06-22
Applicant: 之江实验室
IPC: G06V40/10 , G06V10/28 , G06V10/46 , G06V10/764 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了一种行人图像不变性特征提取和无监督行人重识别方法与装置,通过模型分离实现神经网络部分知识迁移,从辅助模型中提取行人图像的行人主体(图像前景)的不变性特征表达;根据行人主体的不变性特征,利用K远邻聚类算法估计行人图像中潜在的相同行人,构建同一行人不同背景的联系,挖掘行人图像的背景风格的不变性特征表达;将上述的行人图像中行人主体和背景风格的不变性特征表达进行融合,得到输出特征,用于判别行人身份,进行行人重识别。本发明在多个行人重识别数据集上超过目前最好的基于无监督迁移学习的算法,解决了相关技术中提到的行人图像的背景风格差异显著,导致迁移学习效率低下的问题。
-
公开(公告)号:CN115578461B
公开(公告)日:2023-03-10
申请号:CN202211419607.4
申请日:2022-11-14
Applicant: 之江实验室
Abstract: 本发明公开了一种基于双向RGB‑D特征融合的物体姿态估计方法及装置,该方法的核心创新点为特征双向融合模块,通过将RGB与点云特征投影到标准空间以实现对齐,互补和相互增强的作用,提升了最终RGB‑D特征的显著性与代表性。此外,本发明还创新性地引入了感兴趣区域检测,特征恒等映射与残差融合,多任务协同训练,关键点投票与聚类,最小二乘法姿态解算等关键方法,极大改善了传统物体六自由度姿态估计中存在的抗干扰能力弱,精度不足等痛点问题。经多个实际场景测试,本发明可在杂乱环境下,高鲁棒性和高精度地实现对遮挡物体的六自由度姿态估计。
-
公开(公告)号:CN115743353A
公开(公告)日:2023-03-07
申请号:CN202211476614.8
申请日:2022-11-23
Applicant: 之江实验室
IPC: B62D57/032
Abstract: 一种轻质一体化双足机器人大腿结构,包括大髋部电机a、髋部电机b、膝部电机及大腿结构本体;大腿结构本体包括腿外壳、髋部电机a、髋部电机b以及膝部电机;大腿外壳的壳面采用轻量化的拓扑结构;大腿外壳的上部两侧相对设有一对安装孔a1,髋部电机a安装在安装孔a1上;大腿外壳的中部两侧相对设有一对安装孔b1,髋部电机b安装在安装孔b1上;大腿外壳的下部两侧相对设有一对安装孔c1,膝部电机安装在安装孔c1上;所述安装孔a1、安装孔b1、安装孔b1的孔壁采用轻量化的点阵结构。本发明融合拓扑优化+点阵填充两种轻量化设计手段,充分地挖掘出大腿结构的减重空间并采用激光选区熔化成型的工艺实现该类结构的制备。
-
公开(公告)号:CN115731940A
公开(公告)日:2023-03-03
申请号:CN202211570644.5
申请日:2022-12-08
Applicant: 之江实验室
IPC: G10L21/0208 , G10L25/27
Abstract: 本发明公开了语音信号单通道去混响方法及装置、终端、可读存储介质,该方法包括:获取单通道时域信号并进行分帧、加窗、傅里叶变换,得到单通道频域信号;利用前D帧单通道频域信号,计算晚期混响权重系数;根据单通道频域信号和对应的晚期混响权重系数,估计后验信噪比和先验信噪比;利用上一帧增强后语音信号和上一帧频域信号,计算当前帧语音存在概率;利用上一帧增益控制参数和当前帧语音存在概率,计算增益控制参数;根据先验信噪比、后验信噪比,计算得到增益函数;利用增益控制参数、增益函数和单通道频域信号,估计增强后的语音频域信号;将增强后的语音频域信号与设定门限比较并根据比较结果进行更新,做逆傅里叶变换转换到时域并输出。
-
公开(公告)号:CN115546829A
公开(公告)日:2022-12-30
申请号:CN202211187402.8
申请日:2022-09-28
Applicant: 之江实验室
Abstract: 本发明公开了基于ZED立体相机的行人空间信息感知方法及装置,主要用于展厅等公共场景下导览机器人对行人的空间位置及移动速度的智能感知。利用ZED双目视觉相机采集场景下的实时数据并上传至云端服务器;将预处理后RGB数据输入到部署好的人体关键点检测网络获取人体关键点二维信息,根据行人上半身主干区域的人体二维关键点信息生成行人包围框;对连续多帧下的多目标行人进行持续跟踪;结合点云数据获取相应区域的人体关键点三维空间坐标,并计算行人空间位置及移动速度;最后导览机器人根据获取到的行人空间信息进行本体移动控制,完成自主跟随及避障等智能导览任务,从而增加导览机器人的灵活性,提升参观者的交互体验。
-
-
-
-
-
-
-
-
-