-
公开(公告)号:KR102237286B1
公开(公告)日:2021-04-07
申请号:KR1020190028107A
申请日:2019-03-12
Applicant: 울산과학기술원
IPC: G10L25/78 , G10L19/008 , G10L19/04 , G10L19/26
CPC classification number: G10L25/78 , G10L19/008 , G10L19/04 , G10L19/26
Abstract: 본 발명은 음성 구간 검출장치 및 그 방법에 관한 것이다.
본 발명에 따르면, 음성 구간 검출 장치를 이용한 음성 검출 방법에 있어서, 복수의 사용자들로부터 녹음된 복수의 음원 파일을 각각 획득하고, 상기 음원 파일에 저장된 음원 신호를 전처리하는 단계, 상기 전처리된 음원 신호를 이용하여 복수의 윈도우 크기를 가지는 파생 변수를 생성하는 단계, 상기 파생 변수를 로지스틱 회기 모델에 적용하여 상기 음원 신호가 음성일 확률을 예측하는 단계, 상기 예측된 음성 확률이 제1 기준값이상이면 전처리된 음원 신호를 음성으로 판단하여 해당 음원 신호를 1로 변환하고, 상기 예측된 음성 확률이 제2 기준값 미만이면 해당 음원 신호를 노이즈로 판단하여 0으로 변환하고, 상기 예측된 음성 확률이 제2 기준값 이상이고 제1 기준값 미만이면 음원 신호를 0.5로 변환하여 평활화 하는 단계, 그리고 상기 평활화된 음원 신호를 최종 음성구간으로 검출하는 단계를 포함한다.