-
1.
公开(公告)号:KR20210027330A
公开(公告)日:2021-03-10
申请号:KR1020210027569A
申请日:2021-03-02
Applicant: 한국전자통신연구원
IPC: G10L19/008 , G10L19/16 , G10L19/22 , H04H20/89 , H04H20/95 , H04N21/233 , H04N21/439 , H04N21/81
CPC classification number: G10L19/008 , G10L19/167 , G10L19/22 , H04H20/89 , H04H20/95 , H04N21/2335 , H04N21/4394 , H04N21/8106
Abstract: 멀티 채널 오디오 부호화 및 복호화를 이용하여 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법이 제공된다. 방송 송신 장치는 멀티 채널 오디오 신호가 객체 기반 오디오 신호인지, 서라운드 오디오 신호인지를 식별하기 위한 오디오 식별 정보를 생성할 수 있다. 그러면, 방송 재생 장치는 오디오 식별 정보에 기초하여 멀티 채널 오디오 신호가 객체 기반 오디오 신호인 경우, 멀티 채널 오디오 신호를 채널 별로 제어하여 출력할 수 있다.
-
2.
公开(公告)号:KR20210035042A
公开(公告)日:2021-03-31
申请号:KR1020200109402A
申请日:2020-08-28
Applicant: 한국전자통신연구원 , 연세대학교 산학협력단
Abstract: 감정 간의 강도 조절이 가능한 감정 음성 생성 방법 및 장치이 개시된다. 감정 음성 생성 방법은 동일한 감정을 표현하는 가중치 벡터들을 그룹화하여 감정 군집들을 생성하는 단계; 동일한 감정 군집에 포함된 가중치 벡터들 간의 거리인 내부 거리를 결정하는 단계; 서로 다른 감정 군집에 포함된 가중치 벡터들 간의 거리인 외부 거리를 결정하는 단계; 상기 내부 거리 및 상기 외부 거리에 기초하여 상기 감정 군집들 각각의 대표 가중치 벡터를 결정하는 단계; 감정을 표현하기 위한 운율의 정보가 포함된 스타일 토큰에 상기 감정 군집의 대표 가중치 벡터를 적용하여 스타일 임베딩을 생성하는 단계; 및 상기 스타일 임베딩을 이용하여 감정을 나타내는 감정 음성을 생성하는 단계를 포함할 수 있다.
-
公开(公告)号:KR20210030886A
公开(公告)日:2021-03-18
申请号:KR1020200115530A
申请日:2020-09-09
Applicant: 한국전자통신연구원
IPC: G10L19/032 , G06N3/08
CPC classification number: G10L19/032 , G06N3/08
Abstract: 동적 모델 파라미터를 이용한 오디오 부호화 방법 및 오디오 복호화 방법, 오디오 부호화 장치 및 오디오 복호화 장치가 개시된다. 동적 모델 파라미터를 이용한 오디오 부호화 방법은 부호화 네트워크에서 오디오 신호의 차원을 축소할 때 레벨들 각각에 대응하는 동적 모델 파라미터를 이용할 수 있다. 그리고, 동적 모델 파라미터를 이용한 오디오 복호화 방법은 부호화 네트워크에서 오디오 신호의 차원을 확장할 때 레벨들 각각에 대응하는 동적 모델 파라미터를 이용할 수 있다.
-
4.
公开(公告)号:KR102234470B1
公开(公告)日:2021-04-01
申请号:KR1020170030410A
申请日:2017-03-10
Applicant: 한국전자통신연구원
IPC: H04N21/2368 , H04N21/434 , H04N21/81
CPC classification number: H04N21/2368 , H04N21/4341 , H04N21/812 , H04N21/816
Abstract: 컨텐츠 처리 방법이 실시된다.
본 발명의 일실시예에 따른 컨텐츠 처리 방법은 방송 데이터 및 부가 정보가 삽입된 광고 데이터가 포함된 컨텐츠를 수신하는 단계; 상기 광고 데이터에서 상기 부가 정보를 추출하는 단계; 상기 추출한 부가 정보를 이용하여 컨텐츠에서 광고 데이터를 식별하는 단계; 상기 컨텐츠에서 식별된 광고 데이터를 제외한 나머지 방송 데이터를 추출하는 단계를 포함하고, 상기 부가 정보는, 상기 광고 데이터에 대한 오디오 신호의 복수의 분석 구간들에 삽입된 테스트용 부가 정보에 의해 결정되는 적어도 하나의 최적 구간들에 삽입될 수 있다.-
公开(公告)号:KR20210033963A
公开(公告)日:2021-03-29
申请号:KR1020210035360A
申请日:2021-03-18
Applicant: 한국전자통신연구원 , 경기대학교 산학협력단
CPC classification number: H04S5/02 , G10L19/167 , H04S2400/01
Abstract: 동적 포맷 변환을 지원하는 오디오 메타데이터 제공 장치 및 오디오 데이터 재생 장치, 상기 장치가 수행하는 방법 그리고 상기 동적 포맷 변환들이 기록된 컴퓨터에서 판독 가능한 기록매체가 개시된다. 동적 포맷 변환 정보는 다채널 오디오 데이터의 저작자가 설정한 제1 포맷과 다채널 오디오 데이터의 재생 환경에 따른 제2 포맷 간의 복수의 포맷 변환 방식들이 다채널 오디오 데이터의 재생 구간 별로 설정된 것이다. 오디오 메타데이터 제공 장치 및 제공방법은 동적 포맷 변환 정보를 포함하는 메타데이터를 제공한다. 다채널 오디오 데이터 재생 장치는 오디오 메타데이터에서 동적 포맷 변환 정보를 식별한다. 식별한 동적 포맷 변환 정보에 의하여, 다채널 오디오 데이터 재생 장치는 다채널 오디오 데이터의 저작자가 설정한 제1 포맷의 다채널 오디오 데이터를 다채널 오디오 데이터의 재생 환경에 기초한 제2 포맷으로 변환한다. 다채널 오디오 데이터 재생 장치는 변환된 다채널 오디오 데이터를 재생한다.
-
公开(公告)号:KR102226071B1
公开(公告)日:2021-03-11
申请号:KR1020190093378A
申请日:2019-07-31
Applicant: 한국전자통신연구원
CPC classification number: H04S7/305 , H04S7/302 , G10L19/008 , H04S3/008 , H04S2420/01 , H04S2420/03
Abstract: 다채널 오디오 신호의 바이노럴 렌더링 방법 및 장치가 개시된다. 바이노럴 렌더링 방법은 바이노럴 필터로부터 초기 반사음 성분과 잔향 성분을 추출하는 단계; 상기 초기 반사음 성분에 기초하여 다채널 오디오 신호를 바이노럴 렌더링함으로써 스테레오 오디오 신호를 생성하는 단계; 및 상기 잔향 성분을 상기 생성된 스테레오 신호에 적용하는 단계를 포함할 수 있다.
-
公开(公告)号:KR102231750B1
公开(公告)日:2021-03-25
申请号:KR1020190073485A
申请日:2019-06-20
Applicant: 한국전자통신연구원 , 경기대학교 산학협력단
CPC classification number: H04S5/02 , G10L19/167 , H04S2400/01
Abstract: 동적 포맷 변환을 지원하는 오디오 메타데이터 제공 장치 및 오디오 데이터 재생 장치, 상기 장치가 수행하는 방법 그리고 상기 동적 포맷 변환들이 기록된 컴퓨터에서 판독 가능한 기록매체가 개시된다. 동적 포맷 변환 정보는 다채널 오디오 데이터의 저작자가 설정한 제1 포맷과 다채널 오디오 데이터의 재생 환경에 따른 제2 포맷 간의 복수의 포맷 변환 방식들이 다채널 오디오 데이터의 재생 구간 별로 설정된 것이다. 오디오 메타데이터 제공 장치 및 제공방법은 동적 포맷 변환 정보를 포함하는 메타데이터를 제공한다. 다채널 오디오 데이터 재생 장치는 오디오 메타데이터에서 동적 포맷 변환 정보를 식별한다. 식별한 동적 포맷 변환 정보에 의하여, 다채널 오디오 데이터 재생 장치는 다채널 오디오 데이터의 저작자가 설정한 제1 포맷의 다채널 오디오 데이터를 다채널 오디오 데이터의 재생 환경에 기초한 제2 포맷으로 변환한다. 다채널 오디오 데이터 재생 장치는 변환된 다채널 오디오 데이터를 재생한다.
-
8.
公开(公告)号:KR20210027343A
公开(公告)日:2021-03-10
申请号:KR1020210028295A
申请日:2021-03-03
Applicant: 한국전자통신연구원
CPC classification number: H04S7/305 , H04S7/302 , G10L19/008 , H04S3/008 , H04S2420/01 , H04S2420/03
Abstract: 다채널 오디오 신호의 바이노럴 렌더링 방법 및 장치가 개시된다. 바이노럴 렌더링 방법은 바이노럴 필터로부터 초기 반사음 성분과 잔향 성분을 추출하는 단계; 상기 초기 반사음 성분에 기초하여 다채널 오디오 신호를 바이노럴 렌더링함으로써 스테레오 오디오 신호를 생성하는 단계; 및 상기 잔향 성분을 상기 생성된 스테레오 신호에 적용하는 단계를 포함할 수 있다.
-
-
-
-
-
-
-