-
公开(公告)号:CN108133709A
公开(公告)日:2018-06-08
申请号:CN201711236753.2
申请日:2017-11-30
Applicant: 奥林巴斯株式会社
CPC classification number: G10L15/02 , G06K9/00335 , G10L15/25 , G10L25/57 , G10L2015/027
Abstract: 本发明提供语音识别装置和语音识别方法。一个实施方式的语音识别装置具有:取得部,其取得对人发出的语音进行录音而得到的音频流、以及拍摄所述人的至少嘴部而得到的视频流;语音识别部,其根据所述音频流,识别包含所述人发出的辅音在内的语音;辅音估计部,其根据所述视频流的所述人的嘴部的形状,估计所述人发出的辅音;以及辅音确定部,其根据由所述辅音估计部估计出的辅音和由所述语音识别部识别出的辅音,来确定辅音。
-
公开(公告)号:CN108133709B
公开(公告)日:2021-09-14
申请号:CN201711236753.2
申请日:2017-11-30
Applicant: 奥林巴斯株式会社
Abstract: 本发明提供语音识别装置和语音识别方法。一个实施方式的语音识别装置具有:取得部,其取得对人发出的语音进行录音而得到的音频流、以及拍摄所述人的至少嘴部而得到的视频流;语音识别部,其根据所述音频流,识别包含所述人发出的辅音在内的语音;辅音估计部,其根据所述视频流的所述人的嘴部的形状,估计所述人发出的辅音;以及辅音确定部,其根据由所述辅音估计部估计出的辅音和由所述语音识别部识别出的辅音,来确定辅音。
-