Invention Application
- Patent Title: 발화 대상을 구분하여 음성 처리하는 방법 및 장치
- Patent Title (English): METHOD AND DEVICE FOR PROCESSING SPEECH BY DISTINGUISHING SPEAKERS
-
Application No.: PCT/KR2022/008593Application Date: 2022-06-17
-
Publication No.: WO2023027308A1Publication Date: 2023-03-02
- Inventor: 박민정 , 김철귀 , 유주영 , 조남민
- Applicant: 삼성전자 주식회사
- Applicant Address: 16677 경기도 수원시 영통구 삼성로 129, Gyeonggi-do
- Assignee: 삼성전자 주식회사
- Current Assignee: 삼성전자 주식회사
- Current Assignee Address: 16677 경기도 수원시 영통구 삼성로 129, Gyeonggi-do
- Agency: 윤앤리특허법인(유한)
- Priority: KR10-2021-0113794 2021-08-27
- Main IPC: G10L15/28
- IPC: G10L15/28 ; G10L15/04 ; G10L15/25 ; H04N7/18 ; H04R1/40 ; G06F3/01 ; G10L15/06 ; G10L15/22
Abstract:
본 발명의 다양한 실시 예들은 서로 다른 위치에 배치된 복수의 카메라들, 서로 다른 위치에 배치된 복수의 마이크들, 메모리, 및 상기 복수의 카메라들, 상기 복수의 마이크들, 및 상기 메모리 중 적어도 하나와 작동적으로 연결된 프로세서를 포함하고, 상기 프로세서는, 상기 복수의 카메라들 중 적어도 하나를 이용하여 상기 전자 장치를 착용한 사용자 또는 상기 사용자와 대화하는 상대방 중 적어도 하나가 발화하는지 여부를 판단하고, 상기 판단 결과에 기반하여 상기 복수의 마이크들 중 적어도 하나의 지향성을 설정하고, 상기 설정된 지향성에 기반하여 상기 복수의 마이크들 중 적어도 하나로부터 오디오를 획득하고, 상기 복수의 카메라들 중 적어도 하나로부터 상기 사용자 또는 상기 상대방의 입 모양이 포함된 이미지를 획득하고, 상기 획득한 오디오 및 상기 이미지에 기반하여 발화하는 대상의 음성을 서로 다른 방식으로 처리하도록 설정된 방법 및 장치에 관하여 개시한다. 다양한 실시 예들이 가능하다.
Information query