摘要:
There are provided an estimation system, an estimation program and an estimation method through which voice spoken by a subject is estimated, a disease from which the subject is suffering is distinguished and estimated, aggravation of the disease is prevented, and patients are able to receive appropriate treatment based on accurate distinguishing of the disease.
摘要:
The present disclosure provides a system for predicting a disease state based on speech occurrences. A feature extraction module extracts a plurality of lingual features from a speech record of the speech occurrence. The lingual features are chosen based on a correlation between the lingual features and the disease state in at least a first language and a second language. The lingual features are consistent for transcripts in at least the first language and the second language. A prediction module including a trained classification model generates a prediction of the disease state for speech occurrences in at least the first language and the second language using the lingual features extracted from the speech records.
摘要:
The present invention relates to a method for assisting an interviewing party in deciding a response action in response to an interview between said interviewing party and an interviewee party. The method comprises processing the voice of the interviewee party by an anomaly routine using a statistically learned model, upon detection of a sequence of normal samples, processing said samples by an audio recognition model to detect an audio feature, processing said audio feature with an action prediction model to determine an expected response action to be output on a display or loudspeaker to the interviewing party for assisting the interviewing party.
摘要:
A voice interaction system capable of appropriately handling a situation so as to effectively prevent a response error from occurring is provided. A speech acquisition unit 102 acquires user speech. A feature extraction unit 104 extracts a feature of the user speech. A response determination unit 120 determines a response corresponding to the extracted feature vector using any one of a plurality of learning models. A response execution unit 130 executes the determined response. A user state detection unit 140 detects a user state. A learning model selection unit 150 selects a learning model from a plurality of learning models in accordance with the detected user state. The response determination unit 120 determines a response using the selected learning model.
摘要:
Systems and methods are provided for analyzing voice-based audio inputs. A voice-based audio input associated with a user (e.g., wherein the voice-based audio input is a prompt or a command) is received and measures of one or more features are extracted. One or more parameters are calculated based on the measures of the one or more features. The occurrence of one or more mistriggers is identified by inputting the one or more parameters into a predictive model. Further, systems and methods are provided for identifying human mental health states using mobile device data. Mobile device data (including sensor data) associated with a mobile device corresponding to a user is received. Measurements are derived from the mobile device data and input into a predictive model. The predictive model is executed and outputs probability values of one or more symptoms associated with the user.
摘要:
Offenbart wird ein Verfahren zum Beurteilen einer Qualität eines Stimmeinsatzes eines Sprechenden, wobei ein akustisches Sprachsignal des Sprechenden erfasst und in ein digitales Sprachsignal gewandelt wird, wobei das digitale Sprachsignal in seinem zeitlichen Verlauf analysiert wird, um a. In dem zeitlichen Verlauf des digitalen Sprachsignals einen Zeitpunkt des Stimmeinsatzes des Sprechenden zu bestimmen, b. eine Grundfrequenz des Sprachsignals zum Zeitpunkt des Stimmeinsatzes zu ermitteln, c. aus dem digitalen Sprachsignal in einem vorgegebenen Zeitintervall ab dem Zeitpunkt des Stimmeinsatzes zeitlich aufgelöst den Verlauf der bei der Grundfrequenz in dem Sprachsignal enthaltenen Energie zu ermitteln; d. aus dem digitalen Sprachsignal in dem vorgegebenen Zeitintervall zeitlich aufgelöst den Verlauf der bei wenigstens einem harmonischen Vielfachen der Grundfrequenz in dem Sprachsignal enthaltenen Energie zu ermitteln; e. den zeitlichen Verlauf des Verhältnisses der in Schritten c und d ermittelten Energien zu bestimmen, wobei auf einen weichen Stimmeinsatz geschlossen wird, wenn in dem Zeitintervall das gemäß vorstehenden Schritt e. ermittelte Verhältnis der Energien zunächst von der Energie bei der Grundfrequenz dominiert wird, erst im weiteren Verlauf des vorgegebenen Zeitintervalls in einer Zeitspanne Δt das Verhältnis der Energien sich zugunsten der Energie(n) bei der/den harmonischen Vielfachen der Grundfrequenz verschiebt. Weiterhin offenbart werden ein Datenverarbeitungsprogramm für die rechnergestützte, automatisierte Beurteilung einer Qualität eines Stimmeinsatzes eines Sprechenden, das ein solches Verfahren umsetzt, sowie ein rechnergestütztes Datenverarbeitungsgerät mit einem solchen Datenverarbeitungsprogramm. Mit der Erfindung lässt sich die Qualität eines Stimmeinsatzes eines Sprechenden sehr viel besser und genauer automatisiert beurteilen, als dies nach dem Stand der Technik möglich war.