扫地机器人的测试方法、系统和相关装置

    公开(公告)号:CN119334674A

    公开(公告)日:2025-01-21

    申请号:CN202411886130.X

    申请日:2024-12-20

    Inventor: 李达 石超 李如子

    Abstract: 本申请公开了一种扫地机器人的测试方法、系统和相关装置,所述扫地机器人的测试方法应用于目标测试系统,所述目标测试系统包括设置于测试场景中的目标采集装置,所述方法包括:利用所述目标采集装置获取扫地机器人在所述测试场景中的实际运行轨迹;基于所述实际运行轨迹,获取所述扫地机器人在运行过程中的指标信息;其中,所述指标信息是基于所述扫地机器人的清扫面积、所述测试场景中障碍物的实际位置信息以及位置偏差确定的,所述位置偏差是基于所述实际运行轨迹以及所述扫地机器人视角下的目标运行轨迹确定的;基于所述指标信息,获取所述扫地机器人对应的测试结果。通过上述方式,本申请能够提高对扫地机器人进行测试的效率。

    同传质量评测方法及相关装置、设备和存储介质

    公开(公告)号:CN119312818A

    公开(公告)日:2025-01-14

    申请号:CN202411858505.1

    申请日:2024-12-17

    Abstract: 本申请公开了一种同传质量评测方法及相关装置、设备和存储介质,其中,同传质量评测方法包括:基于目标语音的同传文本进行切分,得到若干子文本;获取目标语音中与子文本相对应子语音的刷字数据;其中,子语音的刷字数据包括:子语音在同传过程中从首次出字到逐渐修正直至最终翻译为子文本的若干文本;基于子语音的刷字数据,分析得到子语音的同传质量分;基于各个子语音的同传质量分,融合得到表征目标语音同传质量的目标分值。上述方案,能够在流式同传的应用场景下,提升同传质量评测的准确性。

    语音识别中间结果的质量评测方法和装置

    公开(公告)号:CN110827794A

    公开(公告)日:2020-02-21

    申请号:CN201911257199.5

    申请日:2019-12-06

    Inventor: 李如子 殷运鹏

    Abstract: 本发明实施例提供一种语音识别中间结果的质量评测方法和装置,其中方法包括:确定语音识别的每一中间结果;基于每一中间结果,确定质量评测参数;基于所述质量评测参数,确定质量评测结果。本发明实施例提供的方法和装置,基于每一中间结果,确定质量评测参数,能够从语音结果过程中输出的中间结果整体的角度进行分析,从而提高中间结果质量评测的全面性和准确性。

    声源定位方法及相关装置、设备和存储介质

    公开(公告)号:CN119199741B

    公开(公告)日:2025-05-13

    申请号:CN202411740129.6

    申请日:2024-11-29

    Abstract: 本申请公开了一种声源定位方法及相关装置、设备和存储介质,其中,声源定位方法包括:基于目标设备中目标麦克风阵列采集的待测音频,提取得到相位特征;基于相位特征进行特征采样至目标维度,得到第一特征,以及基于目标设备中目标麦克风阵列的属性信息进行特征提取,得到目标维度的第二特征;其中,属性信息至少包括目标麦克风阵列的排布方式和阵元数量,目标维度为对不同设备进行声源定位时统一的特征维度;基于第一特征和第二特征,融合得到目标特征;基于目标特征,得到待测音频的声源定位结果。上述方案,能够在实现不同设备声源定位通用性的情况下,提升声源定位的准确性。

    语音识别中间结果的质量评测方法和装置

    公开(公告)号:CN110827794B

    公开(公告)日:2022-06-07

    申请号:CN201911257199.5

    申请日:2019-12-06

    Inventor: 李如子 殷运鹏

    Abstract: 本发明实施例提供一种语音识别中间结果的质量评测方法和装置,其中方法包括:确定语音识别的每一中间结果;基于每一中间结果,确定质量评测参数;基于所述质量评测参数,确定质量评测结果。本发明实施例提供的方法和装置,基于每一中间结果,确定质量评测参数,能够从语音结果过程中输出的中间结果整体的角度进行分析,从而提高中间结果质量评测的全面性和准确性。

    一种视频翻译方法及相关装置
    7.
    发明公开

    公开(公告)号:CN119629295A

    公开(公告)日:2025-03-14

    申请号:CN202411879800.5

    申请日:2024-12-19

    Abstract: 本申请公开了一种视频翻译方法及相关装置,涉及视频处理技术领域,包括:获取待翻译的原始视频之后,先利用原始视频中说话者的声纹特征和情绪标签进行语音合成,得到目标语言的语音数据,再将目标语言的语音数据替换原始视频中的原始语音数据,得到初始翻译视频,然后利用目标语言的语音数据进行说话者嘴部区域图像合成,得到说话者嘴部区域的合成图像,最后将说话者嘴部区域的合成图像与初始翻译视频进行融合,得到最终翻译视频。该方案能够尽量还原视频原声,并尽量贴合原视频中人物的说话状态,而且能够保证最终翻译视频中,在口唇画面丢失或者出现前后画面的自然过渡,因此可以提升用户听觉感受和视觉感受。

    声源定位方法及相关装置、设备和存储介质

    公开(公告)号:CN119199741A

    公开(公告)日:2024-12-27

    申请号:CN202411740129.6

    申请日:2024-11-29

    Abstract: 本申请公开了一种声源定位方法及相关装置、设备和存储介质,其中,声源定位方法包括:基于目标设备中目标麦克风阵列采集的待测音频,提取得到相位特征;基于相位特征进行特征采样至目标维度,得到第一特征,以及基于目标设备中目标麦克风阵列的属性信息进行特征提取,得到目标维度的第二特征;其中,属性信息至少包括目标麦克风阵列的排布方式和阵元数量,目标维度为对不同设备进行声源定位时统一的特征维度;基于第一特征和第二特征,融合得到目标特征;基于目标特征,得到待测音频的声源定位结果。上述方案,能够在实现不同设备声源定位通用性的情况下,提升声源定位的准确性。

Patent Agency Ranking