-
公开(公告)号:TWI499287B
公开(公告)日:2015-09-01
申请号:TW102136083
申请日:2013-10-04
申请人: 義大利廣播電視公司 , RAI RADIOTELEVISIONE ITALIANA S. P. A. , 意大利希思衛電子發展股份公司 , S. I. SV. EL SOCIETA'ITALIANA PER LO SVILUPPO DELL'ELETTRONICA S. P. A.
发明人: 米希納 奧柏托 , MESSINA, ALBERTO , 麥塔 沙比諾 , METTA, SABINO , 蒙太諾羅 墨里奇歐 , MONTAGNUOLO, MAURIZIO
IPC分类号: H04N21/25
CPC分类号: G06F17/30746 , G06F17/30038 , G06F17/30796
-
公开(公告)号:TW201327546A
公开(公告)日:2013-07-01
申请号:TW100148662
申请日:2011-12-26
CPC分类号: G06F17/30746 , G10L15/26 , G10L17/00 , G10L2015/088 , G11B27/105
摘要: 一種語音處理方法包括:從一預存的語音檔中提取各發言者的語音特徵;回應用戶的操作,在該語音檔中有與該選擇的聲紋模型匹配的發言者語音時,獲取與該聲紋模型匹配的發言者語音,按照在該語音檔的時間先後順序組成一單一音頻檔,將該單一音頻檔轉換成對應的文本;將該文本中的詞語與對應的時間相關聯;回應用戶操作,當該被轉換的文本中存在輸入的關鍵字時,獲取該文字中的關鍵字所關聯的時間,根據該獲取的時間確定單一音頻檔中該關鍵字對應語音的播放時間點,並控制一音頻播放裝置從該播放時間點開始播放該單一音頻檔。
简体摘要: 一种语音处理方法包括:从一预存的语音档中提取各发言者的语音特征;回应用户的操作,在该语音档中有与该选择的声纹模型匹配的发言者语音时,获取与该声纹模型匹配的发言者语音,按照在该语音档的时间先后顺序组成一单一音频档,将该单一音频档转换成对应的文本;将该文本中的词语与对应的时间相关联;回应用户操作,当该被转换的文本中存在输入的关键字时,获取该文本中的关键字所关联的时间,根据该获取的时间确定单一音频档中该关键字对应语音的播放时间点,并控制一音频播放设备从该播放时间点开始播放该单一音频档。
-
公开(公告)号:TWI395105B
公开(公告)日:2013-05-01
申请号:TW095146435
申请日:2006-12-12
申请人: 富迪科技股份有限公司 , FORTEMEDIA, INC.
发明人: 黃炎松 , YEN-SON PAUL HUANG
CPC分类号: G06F17/30746 , G06F17/30752 , G10L15/26
-
公开(公告)号:TW200419390A
公开(公告)日:2004-10-01
申请号:TW092107121
申请日:2003-03-28
申请人: 李琳山 LEE, LIN SHAN
发明人: 李琳山 LEE, LIN SHAN , 簡立峰 , 陳柏琳 , 王新民 WANG, HSIN MIN
IPC分类号: G06F
CPC分类号: G06F17/30746 , G10L15/26 , G10L2015/027
摘要: 隨著文字、聲音以及多媒體資訊在網際網路上迅速累積並廣泛地被使用,發展以文字或語音型式的查詢指令(textorspeechqueries)去檢索文字或語音型式的資訊(textorspeechinformation)的技術就顯得愈來愈為重要。以語音為基礎之資訊檢索(speech–basedinformationretrieval)指的是使用者的查詢指令以及被檢索的資訊兩者其中至少之一是語音型式。在本發明中,考慮中文的單音節結構(monosyllabicstructure)特性,發展出來一系列以音節(syllable)為基礎的索引特徵(indexingterms),包括了重疊音節片段(overlappingsyllablesegments)及可間隔若干音節之雙音節(syllablepairsseparatedbyafewsyllables),同時也驗證了這一系列以音節為基礎的索引特徵的確具有極強的鑑別能力。此外,在本發明裡也發展出進一步融合以中文的字與詞為基礎的索引特徵的方法,以及若干特別的處理方法,來增強上述這些音節索引特徵的檢索鑑別能力。
简体摘要: 随着文本、声音以及多媒体信息在因特网上迅速累积并广泛地被使用,发展以文本或语音型式的查找指令(textorspeechqueries)去检索文本或语音型式的信息(textorspeechinformation)的技术就显得愈来愈为重要。以语音为基础之信息检索(speech–basedinformationretrieval)指的是用户的查找指令以及被检索的信息两者其中至少之一是语音型式。在本发明中,考虑中文的单音节结构(monosyllabicstructure)特性,发展出来一系列以音节(syllable)为基础的索引特征(indexingterms),包括了重叠音节片段(overlappingsyllablesegments)及可间隔若干音节之双音节(syllablepairsseparatedbyafewsyllables),同时也验证了这一系列以音节为基础的索引特征的确具有极强的鉴别能力。此外,在本发明里也发展出进一步融合以中文的字与词为基础的索引特征的方法,以及若干特别的处理方法,来增强上述这些音节索引特征的检索鉴别能力。
-
公开(公告)号:TW201419840A
公开(公告)日:2014-05-16
申请号:TW102136083
申请日:2013-10-04
申请人: 義大利廣播電視公司 , RAI RADIOTELEVISIONE ITALIANA S. P. A. , 意大利希思衛電子發展股份公司 , S. I. SV. EL SOCIETA'ITALIANA PER LO SVILUPPO DELL'ELETTRONICA S. P. A.
发明人: 米希納 奧柏托 , MESSINA, ALBERTO , 麥塔 沙比諾 , METTA, SABINO , 蒙太諾羅 墨里奇歐 , MONTAGNUOLO, MAURIZIO
IPC分类号: H04N21/25
CPC分类号: G06F17/30746 , G06F17/30038 , G06F17/30796
摘要: 本發明係關於一種透過一多媒體平台(101)推薦多媒體內容之方法,其中該多媒體平台(101)包括透過至少一使用者介面(10)可觀察之複數個多媒體內容,該方法包括下列步驟:該多媒體平台(101)自該使用者介面(10)接收至少一第一命令(204)以選擇至少一第一筆語意資訊與其相關聯之至少一第一多媒體內容(1);該多媒體平台(101)自該使用者介面(10)接收一使用者識別符、一第二命令以選擇至少一第二筆語意資訊與其相關聯之至少一第二多媒體內容(2),且進一步接收關於該第二多媒體內容(2)與所觀察之該第一多媒體內容(1)之間的一關聯之至少一筆資訊(11),其關於語意彙總;該多媒體平台(101)透過該第二筆語意資訊與該第一筆語意資訊之間之一比較而處理(12)代表該使用者識別符、該第一多媒體內容(1)及該第二多媒體內容(2)及該關聯(11)之至少一第一狀態;該多媒體平台基於該第一處理狀態(12)及關於該複數個多媒體內容之與複數個狀態之至少一進一步狀態之一比較而推薦代表至少一第三多媒體內容(3)之至少一第二狀態。本發明亦係關於一種用於推薦多媒體內容之相關聯系統。
简体摘要: 本发明系关于一种透过一多媒体平台(101)推荐多媒体内容之方法,其中该多媒体平台(101)包括透过至少一用户界面(10)可观察之复数个多媒体内容,该方法包括下列步骤:该多媒体平台(101)自该用户界面(10)接收至少一第一命令(204)以选择至少一第一笔语意信息与其相关联之至少一第一多媒体内容(1);该多媒体平台(101)自该用户界面(10)接收一用户识别符、一第二命令以选择至少一第二笔语意信息与其相关联之至少一第二多媒体内容(2),且进一步接收关于该第二多媒体内容(2)与所观察之该第一多媒体内容(1)之间的一关联之至少一笔信息(11),其关于语意汇总;该多媒体平台(101)透过该第二笔语意信息与该第一笔语意信息之间之一比较而处理(12)代表该用户识别符、该第一多媒体内容(1)及该第二多媒体内容(2)及该关联(11)之至少一第一状态;该多媒体平台基于该第一处理状态(12)及关于该复数个多媒体内容之与复数个状态之至少一进一步状态之一比较而推荐代表至少一第三多媒体内容(3)之至少一第二状态。本发明亦系关于一种用于推荐多媒体内容之相关联系统。
-
公开(公告)号:TW201409259A
公开(公告)日:2014-03-01
申请号:TW101130202
申请日:2012-08-21
发明人: 郭台銘 , GOU, TAI MING , 蔡亦文 , CAI, YI WEN , 陳俊銘 , CHEN, CHUN MING
CPC分类号: G06F17/30746 , G10L15/26 , G10L25/54 , G10L25/57
摘要: 一種多媒體記錄系統包括一儲存模組、一辨識模組及一標籤模組。該儲存模組儲存一多媒體檔案,其中該多媒體檔案對應於包含聲音內容的一多媒體資料,該多媒體資料接收自一電腦網路;該辨識模組用於將該多媒體資料的聲音內容轉換為文字;該標籤模組用於根據轉換的文字產生對應的標籤訊息,其中該標籤訊息對應於一個多媒體檔的某部分。
简体摘要: 一种多媒体记录系统包括一存储模块、一辨识模块及一标签模块。该存储模块存储一多媒体文档,其中该多媒体文档对应于包含声音内容的一多媒体数据,该多媒体数据接收自一电脑网络;该辨识模块用于将该多媒体数据的声音内容转换为文本;该标签模块用于根据转换的文本产生对应的标签消息,其中该标签消息对应于一个多媒体档的某部分。
-
公开(公告)号:TW469422B
公开(公告)日:2001-12-21
申请号:TW089100439
申请日:2000-01-12
申请人: 萬國商業機器公司
IPC分类号: G10L
CPC分类号: G06F17/30775 , G06F17/30746 , G10H2210/046 , G10H2210/061 , G10L15/26 , G10L2015/088
摘要: 一種關於對後續資訊回復之音訊流作索引並略讀、找尋及摘錄此音訊流的系統與方法,其中包含利用特殊的聲音前置過濾之方式,使得僅對語音辨識引擎產生的相關語音區段作索引。揭示特定的索引特徵以改善索引字元搜尋後之資訊回復系統的回記精度。本發明包含將該音訊流表示成區間格式,而每個區間包含一個或多個區段,就每個區間之區段而言,其決定於該區段是否顯示一個或多個預定的音訊特徵,如特定的零交越速率範圍、特定的能量範圍及特定的頻譜能量濃度範圍等。此種音訊特徵用啟發方式決定以代表個別的音訊事件,包含靜音、樂音、語音及樂音中之語音等。另外,該音訊特徵亦決定群組區間是否匹配於以啟發方式預先定義的變換圖形,如連續不中斷的語音、總結概念、語音中的猶豫與加重語氣等等,而且,音訊流將會被按照區間類別及變換圖形匹配程度作索引,僅有相關特徵會被索引以改良資訊回復的後續精度。另外,其他由語音辨識引擎產生的長型名稱之選擇文字含被依個別的權重作索引以改善後續的回記。
简体摘要: 一种关于对后续信息回复之音频流作索引并略读、找寻及摘录此音频流的系统与方法,其中包含利用特殊的声音前置过滤之方式,使得仅对语音辨识发动机产生的相关语音区段作索引。揭示特定的索引特征以改善索引字符搜索后之信息回复系统的回记精度。本发明包含将该音频流表示成区间格式,而每个区间包含一个或多个区段,就每个区间之区段而言,其决定于该区段是否显示一个或多个预定的音频特征,如特定的零交越速率范围、特定的能量范围及特定的频谱能量浓度范围等。此种音频特征用启发方式决定以代表个别的音频事件,包含静音、乐音、语音及乐音中之语音等。另外,该音频特征亦决定群组区间是否匹配于以启发方式预先定义的变换图形,如连续不中断的语音、总结概念、语音中的犹豫与加重语气等等,而且,音频流将会被按照区间类别及变换图形匹配程度作索引,仅有相关特征会被索引以改良信息回复的后续精度。另外,其他由语音辨识发动机产生的长型名称之选择文本含被依个别的权重作索引以改善后续的回记。
-
公开(公告)号:TW201528011A
公开(公告)日:2015-07-16
申请号:TW103127977
申请日:2014-08-14
申请人: 咕果公司 , GOOGLE INC.
发明人: 莎瑞菲 馬修 , SHARIFI, MATTHEW
IPC分类号: G06F17/30
CPC分类号: G06F17/30041 , G06F17/30026 , G06F17/30029 , G06F17/30035 , G06F17/30044 , G06F17/30401 , G06F17/30424 , G06F17/30477 , G06F17/3053 , G06F17/30746 , G06F17/30787 , G06F17/30867 , G06F17/30876 , G06Q30/02 , G06Q30/0631 , G10L25/54
摘要: 本發明揭示方法、系統及裝置,其等用於:自一使用者接收包含與由一搜尋查詢之一或多個查詢項提及之一實體相關聯之一實體識別符之一請求;判定該實體在一媒體消費資料庫中被識別為已被指示為由使用者消費之一媒體項目或該實體與在該媒體消費資料庫中被識別為已被指示為由該使用者消費之一媒體項目之一媒體項目相關聯;及基於該判定,對該請求提供一回應,該回應包含指示該實體為已被指示為由該使用者消費之一媒體項目或指示該實體與已被指示為由該使用者消費之一媒體項目相關聯之資料。
简体摘要: 本发明揭示方法、系统及设备,其等用于:自一用户接收包含与由一搜索查找之一或多个查找项提及之一实体相关联之一实体识别符之一请求;判定该实体在一媒体消费数据库中被识别为已被指示为由用户消费之一媒体项目或该实体与在该媒体消费数据库中被识别为已被指示为由该用户消费之一媒体项目之一媒体项目相关联;及基于该判定,对该请求提供一回应,该回应包含指示该实体为已被指示为由该用户消费之一媒体项目或指示该实体与已被指示为由该用户消费之一媒体项目相关联之数据。
-
9.用於內容識別的背景音訊聆聽 BACKGROUND AUDIO LISTENING FOR CONTENT RECOGNITION 审中-公开
简体标题: 用于内容识别的背景音频聆听 BACKGROUND AUDIO LISTENING FOR CONTENT RECOGNITION公开(公告)号:TW201248450A
公开(公告)日:2012-12-01
申请号:TW101110618
申请日:2012-03-27
申请人: 微軟公司
CPC分类号: G06F17/30746
摘要: 本發明揭示各式各樣的具體實施例,使音訊資料(諸如音樂資料)能夠被裝置在背景環境中擷取,並被處理以配製詢問,詢問隨後可被傳送至內容識別服務。在一或多個具體實施例中,音訊資料係於接收相關於音訊資料擷取的使用者輸入之前被擷取,使用者輸入例如啓動相關於內容識別服務的應用程式、提供預動地指示需要音訊資料擷取的使用者輸入及類似者。回應於傳送詢問,相關於音訊資料的可顯示式資訊被內容識別服務傳回,並可由裝置使用。
简体摘要: 本发明揭示各式各样的具体实施例,使音频数据(诸如音乐数据)能够被设备在背景环境中截取,并被处理以配制询问,询问随后可被发送至内容识别服务。在一或多个具体实施例中,音频数据系于接收相关于音频数据截取的用户输入之前被截取,用户输入例如启动相关于内容识别服务的应用进程、提供预动地指示需要音频数据截取的用户输入及类似者。回应于发送询问,相关于音频数据的可显示式信息被内容识别服务传回,并可由设备使用。
-
10.筆型電腦以及產生方法 PEN-TYPE COMPUTER AND GENERATING METHOD 失效
简体标题: 笔型电脑以及产生方法 PEN-TYPE COMPUTER AND GENERATING METHOD公开(公告)号:TW200813748A
公开(公告)日:2008-03-16
申请号:TW095146435
申请日:2006-12-12
CPC分类号: G06F17/30746 , G06F17/30752 , G10L15/26
摘要: 一種用以產生語音索引表的筆型語音電腦及其產生方法。語音索引表的產生方法包括透過麥克風記錄語音資料,藉由手寫輸入裝置輸入圖形資料而產生語音資料之手寫索引,以及找出手寫索引與對應之語音資料之間的關聯性,以產生語音索引表。
简体摘要: 一种用以产生语音索引表的笔型语音电脑及其产生方法。语音索引表的产生方法包括透过麦克风记录语音数据,借由手写输入设备输入图形数据而产生语音数据之手写索引,以及找出手写索引与对应之语音数据之间的关联性,以产生语音索引表。
-
-
-
-
-
-
-
-
-