Invention Grant
- Patent Title: 语音数据生成方法、装置、终端及存储介质
-
Application No.: CN201910611471.9Application Date: 2019-07-08
-
Publication No.: CN110322760BPublication Date: 2020-11-03
- Inventor: 常兵虎 , 胡玉坤 , 车浩
- Applicant: 北京达佳互联信息技术有限公司
- Applicant Address: 北京市海淀区上地西路6号1幢1层101D1-7
- Assignee: 北京达佳互联信息技术有限公司
- Current Assignee: 北京达佳互联信息技术有限公司
- Current Assignee Address: 北京市海淀区上地西路6号1幢1层101D1-7
- Agency: 北京三高永信知识产权代理有限责任公司
- Agent 祝亚男
- Main IPC: G09B21/00
- IPC: G09B21/00 ; G06F16/33 ; G06F16/783 ; G06K9/00 ; G10L13/08 ; G10L13/02
Abstract:
本公开关于一种语音数据生成方法、装置、终端及存储介质,涉及互联网技术领域,该方法包括:从待处理的视频中获取至少一个目标视频帧;对至少一个目标视频帧的手部图像进行手势识别,得到至少一个目标视频帧对应的手势类型;基于至少一个手势类型以及手势类型与词语的对应关系,得到目标语句,目标语句包含至少一个手势类型对应的词语;根据目标语句,生成目标语句对应的语音数据。通过播放语音数据就可以了解到视频中的手语想要表达的内容,实现了听障人士与健听人士之间的无障碍交流。待处理的视频可以由普通摄像头拍摄得到,该方案不依赖特定的设备,可以直接在手机、电脑等终端上直接运行,没有额外的成本,可以更好地在听障人群中普及。
Public/Granted literature
- CN110322760A 语音数据生成方法、装置、终端及存储介质 Public/Granted day:2019-10-11
Information query