摘要:
A method (501, 502) of detecting voice in an audio signal comprises the steps of determining an average peak value (703, AP) representing an envelope of the audio signal, determining a running instance of audio signal standard deviation (702), which corresponds to one of a number of overlapping time intervals, and updating a power density function (PDF) by adding instances of noise to the PDF if the average peak of the audio signal exceeds the current level of the audio signal by a certain amount and if the current standard deviation value falls below a threshold for a predetermined time interval. A noise floor (NF) is located based on the mean value of the PDF (501), and, if the audio signal sustains a power level exceeding the noise floor, voice activity is determined to be present in the audio signal (502). The PDF is updated by a low confidence factor (1206) if all of the standard deviation values calculated during a certain period of time are below the threshold value and by a high confidence factor (1204) if all standard deviation values within a certain longer period of time period are below the threshold value.
摘要:
Speech signals appearing at a receiving and transmitting paths of a speakerphone (10,12,) which operates under voice switching are received at a control circuit (8). The control circuit (8) issues a control signal which assumes a first level in the event that the signal at the receiving path reaches a predetermined level of the signal at the transmitting path and which assumes a second level if the signal at the receiving path falls below the predetermined level. Communication loss is inserted in both the receiving and transmitting paths in response to the first level of the control signal, and is eliminated therefrom in response to the second level of the control signal.
摘要:
Verfahren zur automatischen Sprachrichtungsumschaltung, bei dem ein Empfangssignal mit veränderbarer Dämpfung einem Lautsprecher zugeführt wird, bei dem ein vom einem Mikrofon abgegebenes Signal mit einer veränderbaren Dämpfung als Sendesignal vorgesehen ist, bei dem Empfangssignal und Mikrofonsignal jeweils fortlaufend als Sprachsignal oder Geräusch klassifiziert werden, bei dem die Dämpfung jeweils des einen Signals, das als Sprachsignal klassifiziert worden ist, auf einen ersten Dämpfungswert und das jeweils andere Signal auf einen gegenüber dem ersten größeren zweiten Dämpfungswert eingestellt und so lange beibehalten wird, bis das eine Signal als Geräusch klassifiziert wird, bei dem im Falle der Klassifizierung beider Signale als Sprachsignal die vorhergehenden Dämpfungswerte beibehalten werden, bei dem im Falle der Klassifizierung beider Signale als Geräusch beide Dämpfungen auf einen zwischen erstem und zweitem Dämpfungswert liegenden dritten Dämpfungswert eingestellt werden, und bei dem ein Übergang von erstem oder zweitem Dämpfungswert auf den dritten Dämpfungswert langsamer erfolgt als ein Übergang von drittem Dämpfungswert auf den ersten oder zweiten Dämpfungswert oder ein Übergang von erstem auf zweiten Dämpfungswert und umgekehrt.
摘要:
A handsfree or loudspeaking telephone circuit employing loudest speaker comparison for controlling the direction of transmission of speech signals. The circuit employs the speech network for the handset to provide gain and hybrid functions. The circuit contains logic for controlling the switching between handset operation, handsfree operation and call announcing operation.
摘要:
Schaltungsanordnung für eine sprachgesteuerte Lautfernsprechstation in Fernmelde-, insbesondere Fernsprechanlagen mit kanalindividuellen Verstärkern und mit einer Sprechrichtungserkennungsschaltung, die in Abhängigkeit von einem Spannungsvergleich Dämpfungsglieder in beiden Kanälen so steuert, daß in den Kanal mit der höheren Sprechspannung die Dämpfung verringert und in den Kanal mit der niedrigeren Sprechspannung die Dämpfung entsprechend erhöht wird. Die von den Mikrofon- und Lautsprecherspannungen abgeleiteten Signalspannungen werden jeweils über Operationsverstärker den Gleichrichteranordnungen zugeführt. Dadurch wird die Schwellenspannung der Gleichrichterdioden praktisch eliminiert, so daß starke Regelschwankungen auf den Verbindungsleitungen besser beherrscht werden können.
摘要:
A method (501, 502) of detecting voice in an audio signal comprises the steps of determining an average peak value (703, AP) representing an envelope of the audio signal, determining a running instance of audio signal standard deviation (702), which corresponds to one of a number of overlapping time intervals, and updating a power density function (PDF) by adding instances of noise to the PDF if the average peak of the audio signal exceeds the current level of the audio signal by a certain amount and if the current standard deviation value falls below a threshold for a predetermined time interval. A noise floor (NF) is located based on the mean value of the PDF (501), and, if the audio signal sustains a power level exceeding the noise floor, voice activity is determined to be present in the audio signal (502). The PDF is updated by a low confidence factor (1206) if all of the standard deviation values calculated during a certain period of time are below the threshold value and by a high confidence factor (1204) if all standard deviation values within a certain longer period of time period are below the threshold value.
摘要:
A microphone selection process uses combination values derived in a manner which provides an indication of which one of a plurality of microphones (220-1...220-5) that provides area coverage for a conference room best receives the speech signal. The process selects the microphone which best receives the speech signal by comparing a signal energy value received in each one of the microphones to that received in each of the other microphones. More specifically, pairs of microphones are examined, to determine the direction of origin for the speech, by seeking a microphone pair where the speech is strong in the microphone directed toward the source of speech, and weak in an associated microphone directed away from the source of speech. A null, which is located at the back of each microphone, is narrower than a main beam or sensitivity pattern, which is located at the front of each microphone, is more sensitive to and therefore a better indicator of the direction of origin for the speech than is the main beam.