用于确定音频语句的边界的方法和装置
摘要:
本公开实施例公开了用于确定音频语句的边界的方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:将视频资源中的至少三个连续语句拼接成组合句,根据视频资源的字幕文件从视频资源的音频文件中提取出组合句对应的音频信号,将组合句对应的音频信号输入解码器进行解码,得到组合句对应的音素标签序列,从字幕文件中提取出组合句中的目标语句对应的文本,将目标语句对应的文本转换为声韵母序列,目标语句为组成组合句的至少三个连续语句中不在组合句边缘的语句,以及利用目标语句对应的声韵母序列对组合句对应的音素标签序列进行匹配,以确定目标语句的语音边界。该实施方式实现了对视频资源中的语句的音频的精准切分。
公开/授权文献
0/0