-
公开(公告)号:CN118354028B
公开(公告)日:2024-09-27
申请号:CN202410625786.X
申请日:2024-05-20
Applicant: 国家电网有限公司信息通信分公司
IPC: H04N7/15 , G10L21/0208 , G10L25/51 , G06N3/08
Abstract: 本发明涉及语音分析技术领域,具体涉及一种基于机器学习的视频会议声音延迟检测方法及系统,包括:在视频会议时采集视频数据和每个设备在每个时刻的声音振动数据;根据每个设备与其他设备的声音振动数据在每个预设的延迟时间下的数据差异,对所述延迟时间进行筛选,得到每两个设备在最优延迟时间下的匹配关联度;根据每个设备在每个时刻与其他设备在最优延迟时间下的声音振动数据之间的差异分布、所述匹配关联度得到数据稳定程度,获得每个设备在每个时刻的数据贡献程度;基于数据贡献程度进行特征分解,将特征分解结果和视频数据进行内容匹配,获得视频会议声音延迟的检测结果。本发明利用特征分解结果进行音画匹配的结果更加准确。
-
公开(公告)号:CN118354028A
公开(公告)日:2024-07-16
申请号:CN202410625786.X
申请日:2024-05-20
Applicant: 国家电网有限公司信息通信分公司
IPC: H04N7/15 , G10L21/0208 , G10L25/51 , G06N3/08
Abstract: 本发明涉及语音分析技术领域,具体涉及一种基于机器学习的视频会议声音延迟检测方法及系统,包括:在视频会议时采集视频数据和每个设备在每个时刻的声音振动数据;根据每个设备与其他设备的声音振动数据在每个预设的延迟时间下的数据差异,对所述延迟时间进行筛选,得到每两个设备在最优延迟时间下的匹配关联度;根据每个设备在每个时刻与其他设备在最优延迟时间下的声音振动数据之间的差异分布、所述匹配关联度得到数据稳定程度,获得每个设备在每个时刻的数据贡献程度;基于数据贡献程度进行特征分解,将特征分解结果和视频数据进行内容匹配,获得视频会议声音延迟的检测结果。本发明利用特征分解结果进行音画匹配的结果更加准确。
-