-
公开(公告)号:WO2012070866A2
公开(公告)日:2012-05-31
申请号:PCT/KR2011/008981
申请日:2011-11-23
IPC: G10L19/00
CPC classification number: G10L19/0019 , G10L19/0212 , G10L19/022
Abstract: 본 발명은 스피치 시그널의 부호화 방법 및 복호화 방법에 관한 것으로서, 본 발명에 따른 스피치 시그널의 부호화 방법은 입력 시그널 중 분석 프레임을 특정하는 단계, 상기 분석 프레임을 기반으로 변형 입력을 생성하는 단계, 상기 변형 입력에 윈도우를 적용하는 단계, 윈도우가 적용된 변형 입력을 MDCT(Modified Discrete Cosine Transform) 하여 변환 계수를 생성하는 단계 및 상기 변환 계수를 부호화하는 단계를 포함하며, 상기 변형 입력은 상기 분석 프레임 및 상기 분석 프레임 또는 상기 분석 프레임 중 일부의 자기 복제를 포함할 수 있다.
Abstract translation: 本发明涉及语音信号编码方法和语音信号解码方法。 根据本发明的语音信号编码方法包括以下步骤:从输入信号定义分析帧; 基于分析帧生成修改后的输入; 对修改的输入应用窗口; 对应用窗口的修改输入执行修改后的离散余弦变换(MDCT),以产生变换系数; 以及对所生成的变换系数进行编码,其中所述修改的输入可以包括所述分析框架和所述分析框架的复制,或所述分析框架的一部分的复制。
-
公开(公告)号:WO2011087333A2
公开(公告)日:2011-07-21
申请号:PCT/KR2011/000327
申请日:2011-01-17
Applicant: 엘지전자 주식회사 , 충북대학교 산학협력단 , 정규혁 , 김대환 , 강인규 , 김락용 , 홍기봉 , 박지강 , 이인성 , 임종하 , 문상현 , 이병석 , 전혜정
IPC: G10L19/00 , G10L19/02 , G10L19/038
CPC classification number: G10L19/038 , G10L2019/0002
Abstract: 본 발명은, 오디오 신호 처리 방법 및 장치에 관한 것으로서, 현재 프레임의 오디오 신호에 대해 선형-예측 분석을 수행함으로써, 복수의 선형-예측 변환 계수들에 대응하는 타깃 벡터를 생성하는 단계; 제1 서브벡터 및 제2 서브벡터를 포함하는 복수의 서브벡터로 상기 타깃 벡터를 생성하는 단계; 상기 제1 서브벡터를 벡터 양자화함으로써 제1 코드 벡터를 획득하는 단계; 상기 제1 코드 벡터의 마지막 성분을 이용하여, 상기 제2 서브벡터를 위한 초기 코드북으로부터 하나 이상의 잉여 코드 벡터를 제거하는 단계; 상기 제1 코드 벡터의 마지막 성분을 이용하여, 상기 초기 코드북에 하나 이상의 추가 코드 벡터를 부가함으로써 갱신 코드북을 생성하는 단계; 및, 상기 갱신 코드북을 이용하여, 상기 제2 서브벡터를 벡터 양자화함으로써, 제2 코드 벡터를 획득하는 단계를 포함하고, 상기 추가 코드 벡터는 상기 제1 코드 벡터의 마지막 성분을 기초로 예측된 것이 특징인 오디오 신호 처리 방법이 개시된다.
Abstract translation: 本发明涉及一种用于处理音频信号的方法和装置,其中该方法包括以下步骤:对当前帧的音频信号执行线性预测分析,以产生对应于多个线性预测变换系数的目标矢量 ; 从目标矢量生成包括第一子矢量和第二子矢量的多个子矢量; 矢量量化第一子矢量以获得第一码矢量; 使用所述第一代码矢量的最后一个分量从所述第二子向量的初始代码簿中移除一个或多个冗余代码矢量; 使用第一代码向量的最后一个组件将一个或多个代码向量添加到初始代码簿中以更新代码簿; 以及使用所述更新的代码簿对所述第二子向量进行矢量量化以获得第二代码矢量,其中,基于所述第一代码矢量的最后一个分量来预测所述相加的代码矢量。
-
公开(公告)号:WO2011087332A2
公开(公告)日:2011-07-21
申请号:PCT/KR2011/000324
申请日:2011-01-17
Applicant: 엘지전자 주식회사 , 충북대학교 산학협력단 , 정규혁 , 김대환 , 강인규 , 김락용 , 홍기봉 , 박지강 , 이인성 , 임종하 , 문상현 , 이병석 , 전혜정
IPC: G10L19/20 , G10L21/0208
CPC classification number: G10L19/038 , G10L19/002 , G10L19/0204 , G10L19/0212 , G10L19/028 , G10L19/20 , G10L19/22 , G10L21/038
Abstract: 본 발명은, 오디오 신호에 대해서 주파수 변환을 수행함으로써, 복수 개의 주파수 변환 계수들을 획득하는 단계; 상기 복수 개의 주파수 변환 계수들 중 고주파 대역의 주파수 변환 계수들에 대해서, 펄스 비율을 근거로 일반 모드 및 비-일반모드 중 하나를 선택하는 단계; 및, 상기 비-일반 모드가 선택된 경우, 다음 단계가 수행되는 단계; 상기 고주파 대역의 주파수 변환 계수들로부터 미리 결정된 개수의 펄스들을 추출하고, 펄스 정보를 생성하는 단계; 상기 고주파 대역의 주파수 변환 계수들로부터 상기 펄스들을 제외한 원본 노이즈 신호를 생성하는 단계; 상기 복수 개의 주파수 변환 계수들 중 저주파 대역의 주파수 변환 계수를 이용하여 참조 노이즈 신호를 생성하는 단계; 및, 상기 원본 노이즈 신호 및 상기 참조 노이즈 신호를 이용하여, 노이즈 위치정보 및 노이즈 에너지정보를 생성하는 단계를 포함하는 오디오 신호 처리 방법이 개시된다.
Abstract translation: 本发明涉及一种处理音频信号的方法,包括:对音频信号执行频率转换处理以获得多个频率变换系数的步骤; 对于具有来自多个频率变换系数的高频带的频率变换系数,基于脉冲比选择通用模式或非通用模式的步骤; 以及如果选择了非一般模式,则执行以下步骤:从具有高频带的频率变换系数中提取预定数量的脉冲,并产生脉冲信息; 从除了脉冲之外的具有高频带的频率变换系数产生原始噪声信号; 使用来自所述多个频率变换系数的具有低频带的频率变换系数来生成参考噪声信号; 以及使用原始噪声信号和参考噪声信号产生噪声位置信息和噪声能量信息。
-
-