-
公开(公告)号:CN117727317A
公开(公告)日:2024-03-19
申请号:CN202311778667.X
申请日:2023-12-21
申请人: 恒玄科技(上海)股份有限公司
IPC分类号: G10L21/0232 , G10L19/02 , G10L19/26 , G10L25/30 , G10L21/0208
摘要: 本申请提供一种回声消除方法、装置、音频设备及存储介质。回声消除方法包括:获取麦克风数据经线性回声消除后的初始回声消除结果;将远端语音数据和所述初始回声消除结果输入到预设的深度学习残余回声消除网络,得到频域信号掩码;所述深度学习残余回声消除网络用于以所述远端语音数据为参考信号,确定出所述初始回声消除结果中的非线性回声部分,所述频域信号掩码表征所述初始回声消除结果中需被抑制的信息和/或需保留的信息;基于所述频域信号掩码对所述初始回声消除结果进行残余回声消除,得到残余回声消除后的麦克风数据。该回声消除方法可以提高对不同场景下的麦克风数据进行残余回声消除后的信号质量。
-
公开(公告)号:CN116369887A
公开(公告)日:2023-07-04
申请号:CN202310403329.1
申请日:2023-04-14
申请人: 恒玄科技(上海)股份有限公司
摘要: 本申请提供一种心率估计模型的训练方法及装置、电子设备、存储介质,包括:对初始样本数据逐个通道进行傅里叶变换;其中,所述初始样本数据包括PPG样本和ACC样本;为傅里叶变换结果添加噪声数据,得到目标样本数据;对所述目标样本数据进行傅里叶逆变换,得到增强样本数据;基于所述初始样本数据和所述增强样本数据,对机器学习模型进行训练,得到心率估计模型。本申请方案,降低扩大数据集的人工成本和时间成本,有效训练出泛化性强的心率估计模型。
-
公开(公告)号:CN117807476A
公开(公告)日:2024-04-02
申请号:CN202311863678.8
申请日:2023-12-29
申请人: 恒玄科技(上海)股份有限公司
IPC分类号: G06F18/24 , G06F18/214 , G06F18/21 , G06F18/213 , G06F18/10 , G06N3/04 , G06N3/08 , G06F18/2131
摘要: 本发明提供一种行为活动分类方法、系统、设备及介质,包括:通过采集人员进行行为活动时的传感器信号数据,并利用深度学习网络对不同行为活动进行分类,并且在活动分类训练过程中,在交叉熵损失的基础上又叠加了中心损失,并设计了启发式方式更新加权系数,将两种损失函数加权相加在一起,使两种损失能够均衡主导并进行后续的梯度更新,从而提高活动分类准确率。本发明可以只记录用户的运动数据,不会涉及商业机密或个人身份信息等敏感数据,能够更好地保护用户隐私,不会泄露用户个人身份信息等敏感数据。而且可以实时感知和捕捉到用户的动作和姿态变化,减少了中间环节的干扰,提高活动分类效率,降低了活动分类成本,增强了可靠性和适应性。
-
公开(公告)号:CN117690443A
公开(公告)日:2024-03-12
申请号:CN202311836523.5
申请日:2023-12-27
申请人: 恒玄科技(上海)股份有限公司
IPC分类号: G10L19/26 , G10L21/0216 , G10L25/30
摘要: 本申请涉及语音处理技术领域,公开一种语音处理的方法及装置、电子设备、存储介质。该方法包括:获取上一帧的输出语音数据和当前帧的混合语音数据;根据上一帧的输出语音数据、当前帧的混合语音数据利用预设的神经网络模型获取步长;根据步长更新预设的自适应滤波器中与上一帧的输出语音数据对应的状态估计矩阵;根据更新后的状态估计矩阵、上一帧的输出语音数据和当前帧的混合语音数据确定当前帧的输出语音数据。这样,由于神经网络模型是预先通过大量的语音数据训练获得,能够使得通过神经网络模型确定的步长,更容易使自适应滤波器达到收敛。从而加快自适应滤波器的收敛速度,以更快的抑制声反馈,进而提高用户的体验感。
-
公开(公告)号:CN117530672A
公开(公告)日:2024-02-09
申请号:CN202311833172.2
申请日:2023-12-27
申请人: 恒玄科技(上海)股份有限公司
IPC分类号: A61B5/021
摘要: 本申请提供一种基于PPG信号的血压预测方法及电子设备、计算机可读存储介质,包括:将待测PPG信号转换为模型输入参数;将所述模型输入参数输入已训练的分类模型,通过所述分类模型的M个舒张压分类器输出M个舒张压二分类结果、N个收缩压分类器输出N个收缩压二分类结果;其中,M个舒张压分类器对应M个连续的舒张压数值,N个收缩压分类器对应N个收缩压数值;根据所述M个舒张压二分类结果确定舒张压预测值,根据所述N个收缩压二分类结果确定收缩压预测值。本申请方案,解决了单纯依赖回归方法或分类方法进行预测血压时存在的问题。
-
公开(公告)号:CN117476030A
公开(公告)日:2024-01-30
申请号:CN202311686514.2
申请日:2023-12-08
申请人: 恒玄科技(上海)股份有限公司
IPC分类号: G10L21/0216 , G10L21/0232 , G10L19/02 , G10L21/01 , G10L25/30 , G10L21/0208
摘要: 本发明提供一种回声消除方法及系统、一种语音通信设备及介质,包括:对第一语音信号和第二语音信号进行短时傅里叶变换,得到第一频域信号和第二频域信号;第一语音信号和第二语音信号分别由处于不同地理位置的语音通信设备生成,且第一语音信号包含目标语音信号和回声信号;将第一频域信号和第二频域信号输入至自适应滤波器中进行信号估计,然后进行线性回声信号消除后作为深度学习模型的输入,通过用于进行非线性回声信号消除的深度学习模型来消除残余的非线性回声信号。本发明通过自适应滤波器与深度学习模型形成级联,不仅可以消除线性回声信号,还可以消除非线性回声信号,从而在语音传输过程中获得更好的听感,提升用户体验。
-
公开(公告)号:CN118426576A
公开(公告)日:2024-08-02
申请号:CN202310921976.1
申请日:2023-07-25
申请人: 恒玄科技(上海)股份有限公司
IPC分类号: G06F3/01 , G06F3/0346 , G06F18/214 , G06F18/2415 , G06F18/27
摘要: 本申请提供一种抬腕识别方法、装置及设备,模型训练方法及存储介质,涉及穿戴设备领域。抬腕识别方法获取腕部数据集;所述腕部数据集包括多个采集周期采集的腕部运动数据;将所述腕部数据集输入预设的抬腕识别模型,得到所述抬腕识别模型输出的对所述腕部数据集的抬腕识别结果;所述抬腕识别模型基于正样本集合和负样本集合训练得到;所述正样本集合中包括不同用户的不同抬腕动作的腕部运动数据;所述负样本集合中包括不同用户的不同非抬腕动作的腕部运动数据。上述抬腕识别方法对不同用户的抬腕动作均具有较高的识别准确性,可以提升用户的使用体验。
-
公开(公告)号:CN117731279A
公开(公告)日:2024-03-22
申请号:CN202311746743.9
申请日:2023-12-18
申请人: 恒玄科技(上海)股份有限公司
IPC分类号: A61B5/1455 , A61B5/00 , G06F18/10 , G06F18/20
摘要: 本申请实施例公开了一种血氧饱和度计算方法、装置、存储介质及电子设备。该方法包括:获取传感器检测到红光PPG信号和红外光PPG信号,对红光PPG信号和红外光PPG信号分别进行小波变换,以得到重构后的红光PPG信号和红外光PPG信号,根据重构后的红光PPG信号和红外光PPG信号计算比率值,基于比率值以及传感器参数计算血氧饱和度。本申请实施例提供的方案通过小波变换对PPG信号进行滤波处理,提高了PPG信号的信噪比,从而获得更准确的血氧饱和度,提升了计算的准确性。
-
公开(公告)号:CN116028806A
公开(公告)日:2023-04-28
申请号:CN202211664933.1
申请日:2022-12-23
申请人: 恒玄科技(上海)股份有限公司
IPC分类号: G06F18/214 , A61B5/024 , A61B5/00 , G06N20/00
摘要: 本申请提供一种样本增强方法及装置、心率估计模型训练方法及装置、电子设备和计算机可读存储介质,所述样本增强方法包括:获取待增强样本集;其中,所述待增强样本集包括多个样本,所述多个样本包括PPG数据和\或ACC数据;基于所述待增强样本集中的多个样本和预设的窗函数生成多个增强样本;其中,所述窗函数用于对所述多个样本增加噪声。通过上述方式,在不影响模型预测误差的基础上,改善训练样本不平衡的问题。
-
公开(公告)号:CN117727318A
公开(公告)日:2024-03-19
申请号:CN202311791971.8
申请日:2023-12-22
申请人: 恒玄科技(上海)股份有限公司
IPC分类号: G10L21/0232 , G10L21/0264 , G10L25/18 , G10L25/30 , G10L25/87 , G06N3/047 , G06N3/08 , G10L21/0208
摘要: 本发明涉及人工智能技术领域,公开了一种回声消除、模型训练方法、装置、电子设备及存储介质,该非线性回声消除模型训练方法通过训练样本对包括有非线性回声消除模型和语音端点检测模型的多任务模型进行训练,根据预测语音标签概率数据、预测近端频谱信号以及真实语音标签和真实近端频谱信号确定训练目标不同的多个损失函数,并通过多个损失函数更新多任务模型的参数,将训练后的多任务模型中的非线性回声消除模型确定为训练后的非线性回声消除模型,以完成对非线性回声消除模型的训练,通过使用语音端点检测模型作为辅助任务,能对非语音帧减少回声抑制效果,对语音帧正常进行回声抑制,有效提升识别效果和模型稳定性。
-
-
-
-
-
-
-
-
-