발화 대상을 구분하여 음성 처리하는 방법 및 장치
Abstract:
본 발명의 다양한 실시 예들은 서로 다른 위치에 배치된 복수의 카메라들, 서로 다른 위치에 배치된 복수의 마이크들, 메모리, 및 상기 복수의 카메라들, 상기 복수의 마이크들, 및 상기 메모리 중 적어도 하나와 작동적으로 연결된 프로세서를 포함하고, 상기 프로세서는, 상기 복수의 카메라들 중 적어도 하나를 이용하여 상기 전자 장치를 착용한 사용자 또는 상기 사용자와 대화하는 상대방 중 적어도 하나가 발화하는지 여부를 판단하고, 상기 판단 결과에 기반하여 상기 복수의 마이크들 중 적어도 하나의 지향성을 설정하고, 상기 설정된 지향성에 기반하여 상기 복수의 마이크들 중 적어도 하나로부터 오디오를 획득하고, 상기 복수의 카메라들 중 적어도 하나로부터 상기 사용자 또는 상기 상대방의 입 모양이 포함된 이미지를 획득하고, 상기 획득한 오디오 및 상기 이미지에 기반하여 발화하는 대상의 음성을 서로 다른 방식으로 처리하도록 설정된 방법 및 장치에 관하여 개시한다. 다양한 실시 예들이 가능하다.
Patent Agency Ranking
0/0