一种多模态智能终端的麦克风校准方法及系统

    公开(公告)号:CN118574049B

    公开(公告)日:2024-11-08

    申请号:CN202411046337.6

    申请日:2024-08-01

    IPC分类号: H04R1/08 H04R29/00

    摘要: 本发明涉及音频处理技术领域,具体涉及一种多模态智能终端的麦克风校准方法及系统。其中,所述方法包括:获取麦克风阵列中每一个麦克风接收的混合声音信号;对每一个麦克风接收到的混合声音信号进行分割,得到每一个麦克风对应的多个声源区间;通过ICA分解提取每一个声源区间的主声源分量信号;将每一个麦克风所对应的所有声源区间的主声源分量信号进行拼接,得到每一个麦克风的主声源信号;计算每一个麦克风的每一个声源区间对应的主声源概率;计算主次声源的混淆系数;根据该混淆系数对声源信号强度进行调整。通过该方法,可以对每个时刻接收到的次声源信号进行自适应抑制,从而使得最终合并得到的声音波束中的主声源成分更加清晰准确。

    一种基于混合架构的Web视频直播方法及系统

    公开(公告)号:CN114390034B

    公开(公告)日:2024-11-08

    申请号:CN202111650855.5

    申请日:2021-12-30

    摘要: 本申请提出了一种基于混合架构的Web视频直播方法,该方法包括如下步骤:获取web前端的基础信息,web界面加载基础信息并与音视频播放器建立websocket的连接;web界面发送请求媒体流信令至web后端,web后端将媒体流首次请求的唯一标识返回至web界面;web前端的音视频采集模块收到请求媒体流的信令后,媒体接入模块再将音视频推送至转发模块;web界面将请求媒体流信令的参数及唯一标识同步发送至音视频播放器,音视频播放器将媒体流拉取至音视频播放器并解码播放。通过上述方案能够优化web直播延迟的问题,从而提高用户的体验,确保能够快速实现系统对直播的需求,提升web直播系统的集成性及兼容性。

    一种基于边缘计算的车辆联网方法

    公开(公告)号:CN118647053A

    公开(公告)日:2024-09-13

    申请号:CN202411110734.5

    申请日:2024-08-14

    IPC分类号: H04W28/084 H04W28/08 H04W4/40

    摘要: 本发明涉及车联网技术领域,具体涉及一种基于边缘计算的车辆联网方法,包括:根据边缘计算服务器之间的实时负载量差异,判断边缘计算服务器是否需要进行任务迁移,根据不同任务的任务相关数据之间的相似性、任务间车辆的行驶位置的相似性,获得需迁移边缘计算服务器之间不同任务的数据‑位置相似性,获取迁移动作的奖励函数,从而对Q学习算法的Q矩阵进行迭代更新,得到需迁移边缘计算服务器的最优迁移边缘计算服务器,然后对车联网中边缘计算任务进行迁移。本发明减少了边缘计算服务器的能源消耗,提高了总体资源利用率和负载均衡,提升了车辆联网系统的整体性能和可持续性。

    基于深度学习的移动感知终端语音质量评价方法及系统

    公开(公告)号:CN118645085A

    公开(公告)日:2024-09-13

    申请号:CN202411124123.6

    申请日:2024-08-16

    IPC分类号: G10L15/01 G10L15/06 G10L15/16

    摘要: 本发明涉及语音分析技术领域,具体涉及基于深度学习的移动感知终端语音质量评价方法及系统,包括构建深度学习数学模型,并利用数据集对其进行训练得到语音评价模型;计算测试语音数据的质量表达水平;将测试语音数据输入至语音评价模型计算,得到测试质量评价结果;将测试质量评价结果与质量表达水平进行比较,并对数据集或深度学习数学模型进行修改,直到测试质量评价结果与质量表达水平之差小于预设阈值,得到调整后的语音评价模型;再将语音评价模型用于语音数据的质量评价。本发明通过质量表达水平反向指导语音评价模型修改,克服数据集数量有限的问题,有效提升语音评价模型的泛化水平,有利于移动感知终端语音质量评价准确性。

    基于人工智能的摄像机角度调节方法及系统

    公开(公告)号:CN118609113A

    公开(公告)日:2024-09-06

    申请号:CN202411087917.X

    申请日:2024-08-09

    摘要: 本申请涉及摄像机角度调节技术领域,具体涉及基于人工智能的摄像机角度调节方法及系统,该方法包括:获取摄像机拍摄每辆车的所有帧图像,以及每个车牌的识别时长;确定每辆车车牌的每个角在各帧的行驶轨迹的混乱性;基于每个车牌的不同角在所有帧行驶轨迹的混乱性之间的差异,确定每个车牌行驶轨迹的差异性,结合每个车牌在所有帧图像内车牌边框相对于图像边界的倾斜角度,确定每个车牌在识别过程中的倾斜度;获取低识别效率组和高识别效率组,确定摄像机角度偏差的程度值;判定是否调节摄像机角度,调节方法为:基于低识别效率组中所有车牌的所述倾斜角度调节摄像机角度。本申请旨在提高摄像机角度调节的准确性。

    一种多模态智能终端的麦克风校准方法及系统

    公开(公告)号:CN118574049A

    公开(公告)日:2024-08-30

    申请号:CN202411046337.6

    申请日:2024-08-01

    IPC分类号: H04R1/08 H04R29/00

    摘要: 本发明涉及音频处理技术领域,具体涉及一种多模态智能终端的麦克风校准方法及系统。其中,所述方法包括:获取麦克风阵列中每一个麦克风接收的混合声音信号;对每一个麦克风接收到的混合声音信号进行分割,得到每一个麦克风对应的多个声源区间;通过ICA分解提取每一个声源区间的主声源分量信号;将每一个麦克风所对应的所有声源区间的主声源分量信号进行拼接,得到每一个麦克风的主声源信号;计算每一个麦克风的每一个声源区间对应的主声源概率;计算主次声源的混淆系数;根据该混淆系数对声源信号强度进行调整。通过该方法,可以对每个时刻接收到的次声源信号进行自适应抑制,从而使得最终合并得到的声音波束中的主声源成分更加清晰准确。

    基于人工智能的车辆控制方法及系统

    公开(公告)号:CN118494468A

    公开(公告)日:2024-08-16

    申请号:CN202410954226.9

    申请日:2024-07-17

    IPC分类号: B60W30/09 B60W40/00 B60W50/00

    摘要: 本发明涉及车辆避让控制技术领域,具体涉及基于人工智能的车辆控制方法及系统。该方法基于二维栅格地图中障碍车辆栅格与初始栅格之间的相对信息,根据相对速度以及距离信息确定每个障碍车辆栅格的车辆避让系数。基于运动特征获得障碍车辆栅格相对于非障碍栅格的障碍影响系数,根据障碍影响系数获得的车辆避让估计代价能够同时考虑到障碍车辆的运动状态以及非障碍栅格相对于目标栅格的距离,进而得到科学合理的初始车辆推荐路线。对初始车辆推荐路线进行平滑处理,利用最优车辆推荐路线控制目标车辆进行避让。本发明通过分析障碍车辆的运动特征,获得科学有效的避让路径,实现目标车辆科学、有效、安全地避让。

    地理实体注册方法及程序产品
    9.
    发明公开

    公开(公告)号:CN118394863A

    公开(公告)日:2024-07-26

    申请号:CN202410452019.3

    申请日:2024-04-15

    IPC分类号: G06F16/29 G06T7/73 G06T17/05

    摘要: 本申请提供了一种地理实体注册方法及程序产品,涉及增强现实(AR)技术领域。该方法包括:以待注册实体的观察点为原点,根据地球的切面和法线建立球切平面坐标系;确定地心地固坐标系和球切平面坐标系之间的转换关系、球切平面坐标系和描述观察点和待注册实体之间相对位置关系的增强现实空间(AR‑GIS)坐标系之间的转换关系;根据转换关系将待注册实体在地心地固坐标系中的地理三维位置转换到AR‑GIS坐标系中。本申请提供一种融合视觉与GNSS的实体注册方法,充分考虑真实地理场景的三维空间信息,构建球切平面坐标系来实现虚拟和现实场景之间的高精度坐标匹配,提升视觉注册的精准度和实时性,增强AR可视化效果和应用范围。

    一种监测点位抓拍控制方法及系统

    公开(公告)号:CN118200710A

    公开(公告)日:2024-06-14

    申请号:CN202311358110.0

    申请日:2023-10-19

    摘要: 本发明涉及一种监测点位抓拍控制方法及系统,该方法中包括:根据预测当前时间段监测点位所在道路的两个行驶方向的人车流量对该监测点位设置的多个可旋转摄像装置的朝向进行分配,进而确定各可旋转摄像装置的抓拍区域;通过校准摄像装置对各可旋转摄像装置的旋转角度进行校准;基于校准后的旋转角度控制各可旋转摄像装置进行旋转;实时检测人或车距离监测点位的距离,当检测到距离小于第一距离阈值时,控制可旋转摄像装置进行抓拍;对抓怕图片进行目标检测,提取其中的人物目标图像或车辆目标图像。本发明提高了资源利用率和抓拍图像的质量。