-
-
公开(公告)号:KR102386309B1
公开(公告)日:2022-04-14
申请号:KR1020150079324
申请日:2015-06-04
摘要: 본발명의다양한실시예들은, 전자장치에있어서, 제1 스피커; 제1 마이크; 참조신호를저장하는저장부; 및상기제1 스피커를통해상기참조신호가출력되면, 상기제1 마이크를통해입력된제1 신호와외부전자장치의제2 마이크를통해입력된제2 신호를수신하고, 적어도상기제1 마이크를통해입력된상기제1 신호와상기제2 마이크를통해입력된상기제2 신호에기반하여상기제1 마이크또는상기제2 마이크의사용여부를판단하도록제어하는, 제어부를포함할수 있다. 또한, 본발명의다양한실시예들은다른실시예들이가능할수 있다.
-
公开(公告)号:KR102373199B1
公开(公告)日:2022-03-14
申请号:KR1020217040287
申请日:2018-05-30
IPC分类号: G06F3/0482 , G06F3/0481 , G06F3/16 , G10L21/003 , G10L21/02 , G10L25/78 , G11B27/031 , G11B27/34
摘要: 음성구동동적메뉴들을제공하기위한시스템들, 방법들, 및컴퓨터-판독가능스토리지매체가개시된다. 개시된일 양태는방법으로서, 이는, 전자디바이스에의해, 비디오데이터및 오디오데이터를수신하는단계, 상기전자디바이스에의해, 비디오창을디스플레이하는단계, 상기전자디바이스에의해, 상기오디오데이터가음성신호를포함하는지를결정하는단계, 상기오디오데이터가음성신호를포함하는것에응답하여, 상기전자디바이스에의해, 상기비디오창에제1 메뉴를디스플레이하는단계, 상기오디오데이터에음성신호가없는것에응답하여, 상기전자디바이스에의해, 상기비디오창에제2 메뉴를디스플레이하는단계, 상기전자디바이스에의해, 상기디스플레이된메뉴로부터입력을수신하는단계, 및상기전자디바이스에의해, 상기수신된입력에기초하여출력디바이스에기입하는단계를포함한다.
-
公开(公告)号:KR102357633B1
公开(公告)日:2022-01-28
申请号:KR1020167031864
申请日:2015-04-07
IPC分类号: G10L25/78 , G10L25/48 , G02B27/01 , G10L21/0216
摘要: 컴퓨팅디바이스상의콘텐츠의표현동안대화를감지하는것, 및대화를감지한것에응답하여하나이상의액션을취하는것에관한다양한실시예들이개시된다. 일예시에서, 하나이상의센서로부터오디오데이터스트림이수신되고, 오디오데이터스트림에기반하여제 1 사용자와제 2 사용자사이의대화가감지되며, 대화를감지한것에응답하여디지털콘텐츠아이템의표현이컴퓨팅디바이스에의해변형된다.
-
公开(公告)号:KR102352927B1
公开(公告)日:2022-01-20
申请号:KR1020197036715
申请日:2018-05-09
IPC分类号: G10L25/06 , G10L25/84 , G10L15/20 , G10L21/0216 , G10L21/0264 , G01S3/805 , G01S3/80 , G10L25/78
摘要: 본개시의실시예들에따라, 오디오디바이스에서근접장소스들을검출하기위한방법은제 1 마이크로폰신호와제 2 마이크로폰신호사이의정규화된상호상관함수를계산하는단계, 제 1 마이크로폰신호와제 2 마이크로폰신호의각각의정규화된자기상관함수들을계산하는단계, 정규화된상호상관함수및 정규화된자기상관함수들을복수의타임래그영역들로분할하는단계; 복수의타임래그영역들의각각의개개의타임래그영역에대하여각각의타임래그영역내에서정규화된상호상관함수와정규화된자기상관함수사이의개개의최대편차를계산하는단계; 다수의검출통계값들을도출하기위해복수의타임래그영역들로부터개개의최대편차들을조합하는단계; 및근접장신호를검출하기위해다수의검출통계값들의각각의검출통계값을개개의임계값과비교하는단계를포함할수 있다.
-
公开(公告)号:KR102343811B1
公开(公告)日:2021-12-28
申请号:KR1020200025491
申请日:2020-02-28
IPC分类号: G10L25/78 , G10L25/15 , G10L21/0272
摘要: 음성검출방법이개시된다. 본발명의실시예에따른음성검출방법은, 제1 마이크및 제2 마이크를통하여오디오신호를수신하는단계, 기설정된조건에기반하여, 상기오디오신호에대응하는복수의주파수빈들중 신뢰주파수빈들을선별하는단계, 및, 상기선별된신뢰주파수빈들을이용하여상기오디오신호내 음성의존재여부를검출하는단계를포함한다
-
公开(公告)号:KR102308525B1
公开(公告)日:2021-10-05
申请号:KR1020207016077
申请日:2019-09-25
摘要: 미디어재생시스템을통하여미디어를재생하기위한시스템및 방법은네트워크마이크로폰장치를통하여사운드데이터를캡쳐하는단계와사운드데이터내 후보활성단어를식별하는단계를포함한다. 사운드데이터내 후보활성단어의식별에기초하여, 시스템은복수의활성단어엔진으로부터제1 활성단어엔진을선택한다. 제1 활성단어엔진을통하여, 시스템은사운드데이터를분석하여확인된활성단어를검출하고, 제1 활성단어엔진이확인된활성단어를검출하는것에응답하여, 음성지원서비스와연관된하나이상의원격컴퓨팅장치로상기사운드데이터의음성발화를전송한다.
-
公开(公告)号:KR102292479B1
公开(公告)日:2021-08-24
申请号:KR1020200142889
申请日:2020-10-30
摘要: Vector Quantization 정보를이용한음성신호의폭력구간탐지장치및 방법이제공된다. Vector Quantization 정보를이용한음성신호의폭력구간탐지장치는폭력언어를판별하기위한 m초의음성신호를시간단위로분할하여다수의구간들을생성하는한 세트동작을순차적으로 n(n은 1 이상의양수)회수행하는구간생성부와, 생성된구간별 음성신호를 VQ-Wav2Vec(Vector Quantization Wave to Vector) 모델에입력하여구간별 Vector Quantization(벡터양자화) 정보를출력하는한 세트동작을순차적으로 n회수행하는 VQ-Wav2Vec 처리부와, VQ-Wav2Vec 처리부로부터입력되는구간별 Vector Quantization 정보를딥러닝모델을통해인공지능학습하여구간별로폭력언어여부에대한판별정보를출력하는폭력판별부를포함한다.
-
公开(公告)号:KR102288928B1
公开(公告)日:2021-08-11
申请号:KR1020180152961
申请日:2018-11-30
摘要: 음성활동감지(Voice Activity Detection; VAD) 시스템은, 음향신호를수신하고, 상기음향신호를아날로그신호로변환한후 디지털신호로변환하는입력처리모듈; 상기아날로그/디지털신호들중 하나를수신하고, 사운드활동판정을결정하는에너지기반검출모듈; 상기디지털신호로부터면적관련함수를도출하고, 기계학습방식(Machine-Learning Method)을이용하여상기면적관련함수에따라면적기반판정을출력하는면적함수기반검출모듈; 및상기에너지기반검출모듈로부터의상기사운드활동판정및 상기면적함수기반검출모듈로부터의상기면적기반판정에기초하여최종 VAD 판정을내리는 VAD 판정모듈을포함한다.
-
公开(公告)号:KR20210031265A
公开(公告)日:2021-03-19
申请号:KR20190113010
申请日:2019-09-11
摘要: 개시된실시예에따른전자장치는, 하나이상의인스트럭션들을저장하는메모리, 및상기메모리에저장된하나이상의인스트럭션들을실행하는프로세서를포함하고, 프로세서는, 사용자의발화에대한오디오데이터에기초한사용자의발화특성을이용하여, 음성검출(Voice Activity Dectection)을수행하기위한파라미터를결정하며, 파라미터를이용하여, 사용자의발화에대한음성검출을수행할수 있다.
-
-
-
-
-
-
-
-
-