盲人无障碍电影音频处理方法、装置及存储介质

    公开(公告)号:CN115695902B

    公开(公告)日:2024-09-10

    申请号:CN202211385507.4

    申请日:2022-11-07

    摘要: 本发明涉及一种盲人无障碍电影音频处理方法、装置及存储介质,其中方法包括:分离得到正片视频帧队列QvideoES、正片音频帧队列QaudioES和AD轨音频帧队列QaudioES,并完成时间轴同步;提取正片处理段PCM数据帧序列和AD轨处理段PCM数据帧序列;对AD轨处理段PCM数据帧序列进行语音活动检测,得到每一帧的语音活动状态;对正片处理段PCM数据帧序列的每一帧计算音量,并对该正片音量序列种的元素逐个计算移动平均值;对AD轨处理段PCM数据帧序列中语音活动状态为不活动的帧修改为静音值,并对剩余帧逐个计算移动平均值;基于语音活动检测结果逐帧调节正片平均音量序列和AD轨平均音量序列。与现有技术相比,本发明具有使讲解内容能穿插在高动态范围的电影原声中进行播放等优点。

    盲人无障碍电影音频处理方法、装置及存储介质

    公开(公告)号:CN115695902A

    公开(公告)日:2023-02-03

    申请号:CN202211385507.4

    申请日:2022-11-07

    摘要: 本发明涉及一种盲人无障碍电影音频处理方法、装置及存储介质,其中方法包括:分离得到正片视频帧队列QvideoES、正片音频帧队列QaudioES和AD轨音频帧队列QaudioES,并完成时间轴同步;提取正片处理段PCM数据帧序列和AD轨处理段PCM数据帧序列;对AD轨处理段PCM数据帧序列进行语音活动检测,得到每一帧的语音活动状态;对正片处理段PCM数据帧序列的每一帧计算音量,并对该正片音量序列种的元素逐个计算移动平均值;对AD轨处理段PCM数据帧序列中语音活动状态为不活动的帧修改为静音值,并对剩余帧逐个计算移动平均值;基于语音活动检测结果逐帧调节正片平均音量序列和AD轨平均音量序列。与现有技术相比,本发明具有使讲解内容能穿插在高动态范围的电影原声中进行播放等优点。