-
公开(公告)号:WO2022169038A1
公开(公告)日:2022-08-11
申请号:PCT/KR2021/007818
申请日:2021-06-22
Applicant: 삼성전자주식회사
IPC: H04N21/488 , H04N5/278 , G10L15/26 , G10L15/183
Abstract: 전자 장치 및 그 제어 방법이 개시된다. 전자 장치는 이미지 데이터 및 음성 데이터를 포함하는 컨텐츠를 수신하는 통신 인터페이스, 단어 간의 연관성이 학습된 언어 컨텍스처 모델을 저장하는 메모리, 프로세서 및 디스플레이를 포함하고, 프로세서는 이미지 데이터에 포함된 오브젝트 및 문자를 추출하고, 오브젝트의 오브젝트 이름 및 문자를 식별하며, 식별된 오브젝트의 이름 및 식별된 문자에 기초하여 이미지 데이터와 관련된 이미지 관련 단어를 포함하는 바이어스 키워드 리스트를 생성하고, 바이어스 키워드 리스트 및 언어 컨텍스처 모델에 기초하여 음성 데이터를 텍스트로 변환하며, 음성 데이터로부터 변환된 텍스트를 자막으로 표시하도록 디스플레이를 제어한다.
-
公开(公告)号:WO2023068552A1
公开(公告)日:2023-04-27
申请号:PCT/KR2022/013533
申请日:2022-09-08
Applicant: 삼성전자주식회사
Abstract: 본 전자 장치는 음성 인식 모델 및 음성 인식 모델을 통해 획득한 제1 사용자 음성에 대응되는 제1 인식 정보를 저장하는 메모리, 상기 음성 인식 모델은 제1 네트워크, 제2 네트워크 및 제3 네트워크를 포함하고, 및 제2 사용자 음성을 에 대응되는 음성 데이터를 상기 제1 네트워크에 입력하여 제1 벡터를 획득하고, 제1 인식 정보를 제1 가중치 정보에 기초하여 벡터를 생성하는 상기 제2 네트워크에 입력하여 제2 벡터를 획득하고, 제1 벡터 및 제2 벡터를 제2 가중치 정보에 기초하여 인식 정보를 생성하는 제3 네트워크에 입력하여 제2 사용자 음성에 대응되는 제2 인식 정보를 획득하는 프로세서를 포함하고, 제2 가중치 정보 중 적어도 일부는 제1 가중치 정보와 동일하다.
-
公开(公告)号:WO2022108075A1
公开(公告)日:2022-05-27
申请号:PCT/KR2021/012656
申请日:2021-09-16
Applicant: 삼성전자주식회사
Abstract: 전자 장치는 마이크, 제1 신경망 모델 및 제2 신경망 모델이 저장된 메모리, 통신 인터페이스 및 마이크, 메모리 및 통신 인터페이스와 연결되며, 마이크를 통해 사용자 음성이 수신되면 사용자 음성을 제1 신경망 모델에 입력하여 연산 결과를 획득하고, 연산 결과를 제2 신경망 모델에 입력하여 사용자 음성에 대응되는 적어도 하나의 기기를 식별하며, 연산 결과를 적어도 하나의 기기로 전송하도록 통신 인터페이스를 제어하는 프로세서를 포함하고, 제1 신경망 모델은 음성으로부터 텍스트를 식별하도록 학습된 제3 신경망 모델의 일부 레이어 만이 추가 학습된 후 추가 학습된 일부 레이어 만을 포함하도록 구성된 모델이며, 제2 신경망 모델은 음성에 대응되는 기기를 식별하도록 학습된 모델일 수 있다.
-
-