语音数据生成方法、装置、终端及存储介质
Abstract:
本公开关于一种语音数据生成方法、装置、终端及存储介质,涉及互联网技术领域,该方法包括:从待处理的视频中获取至少一个目标视频帧;对至少一个目标视频帧的手部图像进行手势识别,得到至少一个目标视频帧对应的手势类型;基于至少一个手势类型以及手势类型与词语的对应关系,得到目标语句,目标语句包含至少一个手势类型对应的词语;根据目标语句,生成目标语句对应的语音数据。通过播放语音数据就可以了解到视频中的手语想要表达的内容,实现了听障人士与健听人士之间的无障碍交流。待处理的视频可以由普通摄像头拍摄得到,该方案不依赖特定的设备,可以直接在手机、电脑等终端上直接运行,没有额外的成本,可以更好地在听障人群中普及。
Public/Granted literature
Patent Agency Ranking
0/0