오디오 신호 처리 방법 및 장치
    1.
    发明申请
    오디오 신호 처리 방법 및 장치 审中-公开
    用于处理音频信号的方法和装置

    公开(公告)号:WO2011087333A2

    公开(公告)日:2011-07-21

    申请号:PCT/KR2011/000327

    申请日:2011-01-17

    CPC classification number: G10L19/038 G10L2019/0002

    Abstract: 본 발명은, 오디오 신호 처리 방법 및 장치에 관한 것으로서, 현재 프레임의 오디오 신호에 대해 선형-예측 분석을 수행함으로써, 복수의 선형-예측 변환 계수들에 대응하는 타깃 벡터를 생성하는 단계; 제1 서브벡터 및 제2 서브벡터를 포함하는 복수의 서브벡터로 상기 타깃 벡터를 생성하는 단계; 상기 제1 서브벡터를 벡터 양자화함으로써 제1 코드 벡터를 획득하는 단계; 상기 제1 코드 벡터의 마지막 성분을 이용하여, 상기 제2 서브벡터를 위한 초기 코드북으로부터 하나 이상의 잉여 코드 벡터를 제거하는 단계; 상기 제1 코드 벡터의 마지막 성분을 이용하여, 상기 초기 코드북에 하나 이상의 추가 코드 벡터를 부가함으로써 갱신 코드북을 생성하는 단계; 및, 상기 갱신 코드북을 이용하여, 상기 제2 서브벡터를 벡터 양자화함으로써, 제2 코드 벡터를 획득하는 단계를 포함하고, 상기 추가 코드 벡터는 상기 제1 코드 벡터의 마지막 성분을 기초로 예측된 것이 특징인 오디오 신호 처리 방법이 개시된다.

    Abstract translation: 本发明涉及一种用于处理音频信号的方法和装置,其中该方法包括以下步骤:对当前帧的音频信号执行线性预测分析,以产生对应于多个线性预测变换系数的目标矢量 ; 从目标矢量生成包括第一子矢量和第二子矢量的多个子矢量; 矢量量化第一子矢量以获得第一码矢量; 使用所述第一代码矢量的最后一个分量从所述第二子向量的初始代码簿中移除一个或多个冗余代码矢量; 使用第一代码向量的最后一个组件将一个或多个代码向量添加到初始代码簿中以更新代码簿; 以及使用所述更新的代码簿对所述第二子向量进行矢量量化以获得第二代码矢量,其中,基于所述第一代码矢量的最后一个分量来预测所述相加的代码矢量。

    스피치 시그널 부호화 방법 및 복호화 방법
    2.
    发明申请
    스피치 시그널 부호화 방법 및 복호화 방법 审中-公开
    语音信号编码方法和语音信号解码方法

    公开(公告)号:WO2012070866A2

    公开(公告)日:2012-05-31

    申请号:PCT/KR2011/008981

    申请日:2011-11-23

    CPC classification number: G10L19/0019 G10L19/0212 G10L19/022

    Abstract: 본 발명은 스피치 시그널의 부호화 방법 및 복호화 방법에 관한 것으로서, 본 발명에 따른 스피치 시그널의 부호화 방법은 입력 시그널 중 분석 프레임을 특정하는 단계, 상기 분석 프레임을 기반으로 변형 입력을 생성하는 단계, 상기 변형 입력에 윈도우를 적용하는 단계, 윈도우가 적용된 변형 입력을 MDCT(Modified Discrete Cosine Transform) 하여 변환 계수를 생성하는 단계 및 상기 변환 계수를 부호화하는 단계를 포함하며, 상기 변형 입력은 상기 분석 프레임 및 상기 분석 프레임 또는 상기 분석 프레임 중 일부의 자기 복제를 포함할 수 있다.

    Abstract translation: 本发明涉及语音信号编码方法和语音信号解码方法。 根据本发明的语音信号编码方法包括以下步骤:从输入信号定义分析帧; 基于分析帧生成修改后的输入; 对修改的输入应用窗口; 对应用窗口的修改输入执行修改后的离散余弦变换(MDCT),以产生变换系数; 以及对所生成的变换系数进行编码,其中所述修改的输入可以包括所述分析框架和所述分析框架的复制,或所述分析框架的一部分的复制。

    오디오 신호 처리 방법 및 장치
    3.
    发明申请
    오디오 신호 처리 방법 및 장치 审中-公开
    用于处理音频信号的方法和装置

    公开(公告)号:WO2011087332A2

    公开(公告)日:2011-07-21

    申请号:PCT/KR2011/000324

    申请日:2011-01-17

    Abstract: 본 발명은, 오디오 신호에 대해서 주파수 변환을 수행함으로써, 복수 개의 주파수 변환 계수들을 획득하는 단계; 상기 복수 개의 주파수 변환 계수들 중 고주파 대역의 주파수 변환 계수들에 대해서, 펄스 비율을 근거로 일반 모드 및 비-일반모드 중 하나를 선택하는 단계; 및, 상기 비-일반 모드가 선택된 경우, 다음 단계가 수행되는 단계; 상기 고주파 대역의 주파수 변환 계수들로부터 미리 결정된 개수의 펄스들을 추출하고, 펄스 정보를 생성하는 단계; 상기 고주파 대역의 주파수 변환 계수들로부터 상기 펄스들을 제외한 원본 노이즈 신호를 생성하는 단계; 상기 복수 개의 주파수 변환 계수들 중 저주파 대역의 주파수 변환 계수를 이용하여 참조 노이즈 신호를 생성하는 단계; 및, 상기 원본 노이즈 신호 및 상기 참조 노이즈 신호를 이용하여, 노이즈 위치정보 및 노이즈 에너지정보를 생성하는 단계를 포함하는 오디오 신호 처리 방법이 개시된다.

    Abstract translation: 本发明涉及一种处理音频信号的方法,包括:对音频信号执行频率转换处理以获得多个频率变换系数的步骤; 对于具有来自多个频率变换系数的高频带的频率变换系数,基于脉冲比选择通用模式或非通用模式的步骤; 以及如果选择了非一般模式,则执行以下步骤:从具有高频带的频率变换系数中提取预定数量的脉冲,并产生脉冲信息; 从除了脉冲之外的具有高频带的频率变换系数产生原始噪声信号; 使用来自所述多个频率变换系数的具有低频带的频率变换系数来生成参考噪声信号; 以及使用原始噪声信号和参考噪声信号产生噪声位置信息和噪声能量信息。

    대역 확장 방법 및 장치
    4.
    发明申请
    대역 확장 방법 및 장치 审中-公开
    用于带宽扩展的方法和设备

    公开(公告)号:WO2012108680A2

    公开(公告)日:2012-08-16

    申请号:PCT/KR2012/000910

    申请日:2012-02-08

    CPC classification number: G10L19/00 G10L19/0212 G10L21/0388

    Abstract: 본 발명은 음성 또는 오디오 신호의 신호 대역을 확장하는 방법 및 장치에 관한 것으로서, 본 발명에 따른 대역 확장 방법은 입력 시그널을 MDCT(Modified Discrete Cosine Transform) 하여 제1 변환 신호를 생성하는 단계, 상기 제1 변환 신호를 기반으로 제2 변환 신호 및 제3 변환 신호를 생성하는 단계, 상기 제1 변환 신호, 제2 변환 신호, 제3 변환 신호로부터 각각의 정규 성분 및 에너지 성분을 생성하는 단계, 상기 각각의 정규 신호로부터 확장 정규 성분을 생성하고, 상기 각각의 에너지 성분으로부터 확장 에너지 성분을 생성하는 단계, 상기 확장 정규 성분과 상기 확장 에너지 성분을 기반으로 확장 변환 신호를 생성하는 단계 및 상기 확장 변환 신호를 IMDCT(Inverse MDCT)하는 단계를 포함한다.

    Abstract translation: 本发明

    为负或涉及一种方法和设备来扩展所述音频信号,根据本发明的带宽扩展方法输入信号MDCT的(改进的离散余弦变换),第一转换的信号带宽 基于第一变换信号生成第二变换信号和第三变换信号;根据第一变换信号,第二变换信号和第三变换信号计算每个法向分量和能量; 从每个正常信号生成扩展法向分量,并且从每个能量分量生成扩展能量分量,基于扩展法向分量和扩展能量分量生成扩展变换信号, 并对扩展变换信号执行逆MDCT(IMDCT)。

    오디오 신호 처리 방법 및 장치
    6.
    发明申请
    오디오 신호 처리 방법 및 장치 审中-公开
    用于处理音频信号的方法和设备

    公开(公告)号:WO2012026741A2

    公开(公告)日:2012-03-01

    申请号:PCT/KR2011/006222

    申请日:2011-08-23

    Abstract: 본 발명은, 복수의 스펙트럴 계수들에 해당하는 입력 오디오 신호를 수신하는 단계; 상기 입력 신호의 에너지를 근거로 하여, 상기 스펙트럴 계수들 중에서 특정 스펙트럴 계수의 위치를 지시하는 위치 정보를 획득하는 단계; 상기 위치 정보 및 상기 스펙트럴 계수들을 이용하여 형태 벡터를 생성하는 단계; 상기 형태 벡터에 대응하는 코드북을 탐색함으로써, 코드북 인덱스를 결정하는 단계; 및, 상기 코드북 인덱스 및 상기 위치 정보를 전송하는 단계를 포함하고, 상기 형태 벡터는, 상기 스펙트럴 계수들로부터 선택된 부분을 이용하여 생성되고, 상기 선택된 부분은, 상기 위치 정보에 근거하여 선택된 것임을 특징으로 하는 오디오 신호 처리 방법을 개시한다.

    Abstract translation: < p num =“0000”>本发明包括:接收对应于多个频谱系数的输入音频信号; 基于输入信号的能量获得指示频谱系数中的特定频谱系数的位置的位置信息; 使用位置信息和频谱系数生成形状矢量; 通过搜索与表单矢量对应的码本来确定码本索引; 并且基于位置信息来选择码本索引和位置信息,其中使用从频谱系数中选择的部分来生成形状矢量,并且选择的部分被选择 。“

    오디오 신호 처리 방법 및 장치
    7.
    发明申请
    오디오 신호 처리 방법 및 장치 审中-公开
    用于处理音频信号的方法和装置

    公开(公告)号:WO2012002768A2

    公开(公告)日:2012-01-05

    申请号:PCT/KR2011/004843

    申请日:2011-07-01

    CPC classification number: G10L19/06 G10L19/012 G10L19/22 G10L19/24 G10L25/78

    Abstract: 본 발명은, 오디오 신호 처리 방법으로서, 오디오 신호를 수신하는 단계; 코딩 모드를 지시하는 네트워크 정보를 수신하여, 현재 프레임에 대응하는 코딩 모드를 결정하는 단계; 상기 코딩 모드에 따라서, 상기 오디오 신호의 현재 프레임을 인코딩하는 단계; 및 상기 인코딩된 현재 프레임을 전송하는 단계를 포함하고, 상기 코딩 모드는, 대역폭 및 비트레이트의 조합에 의해 결정되고, 상기 대역폭은 협대역, 광대역, 초광대역 중 둘 이상을 포함한다.

    Abstract translation: 本发明涉及一种处理音频信号的方法,该方法包括以下步骤:接收音频信号; 通过接收用于指示编码模式的网络信息来确定与当前帧相对应的编码模式; 根据所述编码模式对所述音频信号的当前帧进行编码; 并且发送所述编码的当前帧,其中所述编码模式由带宽和比特率的组合确定,并且所述带宽包括窄带,宽带和超宽带中的两个或更多个频带。

    오디오 신호 처리 방법 및 장치
    8.
    发明申请
    오디오 신호 처리 방법 및 장치 审中-公开
    用于处理音频信号的方法和设备

    公开(公告)号:WO2011118977A2

    公开(公告)日:2011-09-29

    申请号:PCT/KR2011/001989

    申请日:2011-03-23

    CPC classification number: G10L19/04 G10L19/06 G10L19/22 G10L19/24

    Abstract: 본 발명은 오디오 신호의 현재 프레임에 대해서 스펙트럼 분석을 수행함으로써, 상기 현재 프레임이 제1 대역 및 제2 대역을 복수의 대역들 중 어디에 해당하는지를 나타내는 대역폭 정보를 결정하는 단계; 상기 대역폭 정보를 근거로, 현재 프레임에 대응하는 차수 정보를 결정하는 단계; 상기 현재 프레임에 대해 선형-예측 분석을 수행함으로써, 제1 차수의 제1셋 선형-예측 변환 계수를 생성하는 단계; 상기 제1 셋 선형-예측 변환 계수를 벡터-양자화함으로써, 제1셋 인덱스를 생성하는 단계; 상기 현재 프레임에 대해 선형-예측 분석을 수행함으로써, 상기 차수 정보에 따라서, 제2 차수의 제2 셋 선형-예측 변환 계수를 생성하는 단계; 및, 상기 제2 셋 선형-예측 변환 계수가 생성된 경우, 상기 제1 셋 인덱스 및 상기 제2 셋 선형-예측 변환 계수를 이용하여 제2셋 차분에 대해 벡터-양자화를 수행하는 단계를 포함하는 오디오 신호 처리 방법을 개시한다.

    Abstract translation: 通过对音频信号的当前帧执行频谱分析,本发明确定指示当前帧是对应于第一频带还是第二频带的带宽信息 步骤; 基于带宽信息确定与当前帧对应的度信息; 对当前帧执行线性预测分析以产生第一组第一组线性预测变换系数; 通过矢量量化第一组线性预测变换系数产生第一组索引; 通过对当前帧执行线性预测分析,根据顺序信息生成第二组第二组线性预测变换系数; 并且当产生第二组线性预测系数时,使用第一组索引和第二组线性预测变换系数对第二组差异执行矢量量化, 一种音频信号处理方法被公开。

    음성 신호 부호화 방법 및 장치
    9.
    发明申请
    음성 신호 부호화 방법 및 장치 审中-公开
    编码语音信号的方法和装置

    公开(公告)号:WO2011071335A2

    公开(公告)日:2011-06-16

    申请号:PCT/KR2010/008848

    申请日:2010-12-10

    Abstract: 본 발명에 따르면, 선형 예측을 이용하여 입력 신호으로부터 현재 프레임의 선형 예측 필터 계수를 획득하고, 제 1 베스트 정보에 기초하여 상기 현재 프레임의 선형 예측 필터 계수에 대응하는 현재 프레임의 양자화된 스펙트럼 후보 벡터를 획득하며, 상기 현재 프레임의 양자화된 스펙트럼 후보 벡터와 이전 프레임의 양자화된 스펙트럼 벡터를 보간하는 것을 특징으로 한다. 이처럼 기존의 단계별 최적화 기법에 비해 양자화 오차를 최소화하는 최적의 파라미터를 찾을 수 있다.

    Abstract translation: 根据本发明,从使用线性预测的输入信号中获取当前帧的线性预测滤波器系数,对应于当前帧的线性预测滤波器系数的当前帧的量化频谱候选矢量被获取在 内插第一最佳信息的基础和当前帧的量化频谱候选矢量和前一帧的量化频谱矢量。 因此,与传统的相位优化技术相反,可以获得最小化量化误差的最佳参数。

    오디오 신호 처리 방법 및 장치
    10.
    发明申请
    오디오 신호 처리 방법 및 장치 审中-公开
    用于处理音频信号的方法和设备

    公开(公告)号:WO2011065741A2

    公开(公告)日:2011-06-03

    申请号:PCT/KR2010/008336

    申请日:2010-11-24

    CPC classification number: G10L19/00 G10L19/005 G10L19/12 G10L2019/0001

    Abstract: 본 발명은, 현재 프레임의 데이터를 포함하는 오디오 신호를 수신하는 단계; 상기 현재 프레임의 데이터에서 에러가 발생한 경우, 랜덤 코드북을 상기 현재 프레임의 데이터에 대한 프레임 에러 은닉을 수행함으로써, 상기 현재 프레임의 제1 임시 출력 신호를 생성하는 단계; 상기 제1 임시 출력 신호를 근거로 하여 숏텀 예측, 롱텀 예측 및 고정 코드북 서치 중 하나 이상을 수행함으로써, 파라미터를 생성하는 단계; 및, 상기 파라미터를 다음 프레임을 위해 메모리를 업데이트하는 단계를 포함하고, 상기 파라미터는 피치 게인, 피치 지연, 고정 코드북 게인, 및 고정 코드북 중 하나 이상을 포함하는 오디오 신호 처리 방법이 개시된다.

    Abstract translation: 本发明包括:接收包括当前帧的数据的音频信号; 如果在当前帧的数据时,通过执行帧错误隐藏的随机码本,所述方法包括在当前帧的数据中的错误:生成所述当前帧的第一临时输出信号; 通过基于第一暂时输出信号执行短期预测,长期预测和固定码本搜索中的至少一个来生成参数; 并更新用于下一帧的存储器,其中该参数包括音调增益,音调延迟,固定码簿增益和固定码簿中的至少一个。 p>

Patent Agency Ranking