-
公开(公告)号:CN103024746A
公开(公告)日:2013-04-03
申请号:CN201210592920.8
申请日:2012-12-30
申请人: 清华大学 , 安徽科大讯飞信息科技股份有限公司
摘要: 一种电信运营商垃圾短信处理系统及处理方法,包括:线上及时处理内核子系统、线下数据挖掘子系统;线上及时处理内核子系统,包括简单规则匹配模块、短信预处理模块、快速模板匹配模块和分类处理模块;线下数据挖掘子系统,包括短信粗选模块和模板聚类模块。本发明能够对海量短信进行多维度有效分类,并具有良好的系统维护性。
-
公开(公告)号:CN103024746B
公开(公告)日:2015-06-17
申请号:CN201210592920.8
申请日:2012-12-30
申请人: 清华大学 , 安徽科大讯飞信息科技股份有限公司
摘要: 一种电信运营商垃圾短信处理系统及处理方法,包括:线上及时处理内核子系统、线下数据挖掘子系统;线上及时处理内核子系统,包括简单规则匹配模块、短信预处理模块、快速模板匹配模块和分类处理模块;线下数据挖掘子系统,包括短信粗选模块和模板聚类模块。本发明能够对海量短信进行多维度有效分类,并具有良好的系统维护性。
-
公开(公告)号:CN103077020A
公开(公告)日:2013-05-01
申请号:CN201210580551.0
申请日:2012-12-27
申请人: 安徽科大讯飞信息科技股份有限公司
IPC分类号: G06F9/44
摘要: 本发明提供一种文本对话服务系统,包含:所述的短信收发模块,为文本收发适配子模块;所述的业务逻辑处理及资源管理模块,与解析器模块一起完成业务流程化处理,完成文本对话功能;所述的解析器模块,完成VXML脚本解析,与资源管理器模块一起完成业务流程化处理,完成文本对话功能;所述的文本识别引擎模块,基于自然语言理解的内置识别引擎,用于识别理解用户意图,实现智能对话功能;所述的管理维护模块,用于Web管理系统配置和监控系统运行情况。本发明采用脚本化的开发方法,应用开发简单、效率高;实现应用与平台的分离,应用开发只需关心核心业务逻辑,与业务无关的系统无需关心,可以直接用来进行人机交互类应用开发。
-
公开(公告)号:CN102982832A
公开(公告)日:2013-03-20
申请号:CN201210484133.1
申请日:2012-11-24
申请人: 安徽科大讯飞信息科技股份有限公司
IPC分类号: G11B27/10
摘要: 一种在线卡拉OK伴奏、人声与字幕的同步方法,在演唱者端进行人声、伴奏混音,加上播放的时间戳编码后发送到流媒体服务器;在收听者端,流媒体播放器线程启动后,首先从服务器端加载歌词,然后接收流媒体数据,采用接收到媒体数据量的大小来同步字幕的播放,从而实现收听者端与演唱者端卡拉OK伴奏、人声与字幕的同步。本发明减少网络带宽的实时传输,在接收者端多媒体播放线程启动前,从服务器上下载完字幕;同时降低CPU的计算消耗,在演唱者端将伴奏与人声进行混音、加上播放时间压缩编码形成多媒体数据块,接收者端进行解码播放,且按播放数据量的大小进行字幕同步。
-
公开(公告)号:CN103117063A
公开(公告)日:2013-05-22
申请号:CN201210578700.X
申请日:2012-12-27
申请人: 安徽科大讯飞信息科技股份有限公司
IPC分类号: G10L19/022 , G10L25/60
摘要: 本发明涉及一种基于软件实现的音乐内容截幅检测方法,用于实现对运营商提供的音乐内容的质量检测,具体为:解析现有的音频文件,将音频文件转化成单通道;对音频数据进行加窗,通常直接使用矩形窗;统计加载的音频信号中超过某一个特定幅度值Fδ的采样点的个数,使用变量sum对个数进行累加统计;计算sum与步骤二中的矩形窗的窗宽M,求出它们的比值ξ,将ξ与选定的阈值α进行比较,判断音频文件是否存在截幅;通过不断的重复加窗、统计频率、计算比值并与阈值比较,最终完成整个音频文件的检测。本发明能够实现快速检测音频截幅问题,检测过程中不需要人工参与,节约人力、提高审核效率,且降低审核出错几率。
-
公开(公告)号:CN103049548A
公开(公告)日:2013-04-17
申请号:CN201210579361.7
申请日:2012-12-27
申请人: 安徽科大讯飞信息科技股份有限公司
IPC分类号: G06F17/30
摘要: 本发明提供一种电子渠道应用上的FAQ识别系统及方法,包括FAQ分词模块、检索出多候选模块、同义词扩展模块、自学习模块;FAQ分词采用电子渠道上专有词典进行要素词分词;根据要素词计算,得到多候选;在计算过程中,采用特定的电子渠道同义词辅助准确计算;最后是离线通过自学习模块对日志进行标注。本发明形成专有字典。对增值业务划分要素词。分为:业务要素词、操作要素词、特殊要素词等。同时支持词性扩展;检索时,侧重于业务要素词检索;同义词也根据词性划分,多组同义词见不传递。使得提高识别率时,多候选中至少出现与用户输入存在相同词;自学习中,知识更新,通过资源升级工具,对比出差异后,提交给运营商知识库人员审核后,线上更新。
-
公开(公告)号:CN103065620B
公开(公告)日:2015-01-14
申请号:CN201210578662.8
申请日:2012-12-27
申请人: 安徽科大讯飞信息科技股份有限公司
摘要: 本发明公开了一种在手机上或网页上接收用户输入的文字并实时合成为个性化声音的方法,涉及语音合成及个性化语音合成技术领域,该方法包括:在手机或网页上输入文字;将文字合成为具有特殊音色特征的个性化声音;用户将个性化的声音设为彩铃或手机铃音,其中在个性化合成系统中采用的远离类中心单元的聚类方法这一新算法。利用本发明,可以实现用户制作个性化彩铃或个性化手机铃音的需求。
-
公开(公告)号:CN101938720A
公开(公告)日:2011-01-05
申请号:CN201010278537.6
申请日:2010-09-06
申请人: 安徽科大讯飞信息科技股份有限公司
摘要: 本发明公开了一种短消息传输方法及系统,所述方法包括:固话网络侧接收文本短消息,从所述文本短消息中解析得到短消息的接收方号码和文本内容;将所述文本内容合成为语音文件;并且,确定所述文本短消息的发送方式;使用确定的所述发送方式向接收方号码对应的固话终端传输所述语音文件,以便于固话终端向终端用户播放所述语音文件。所述方法和系统能够实现将文本短消息传输给固话终端。
-
公开(公告)号:CN102982832B
公开(公告)日:2015-05-27
申请号:CN201210484133.1
申请日:2012-11-24
申请人: 安徽科大讯飞信息科技股份有限公司
IPC分类号: G11B27/10
摘要: 一种在线卡拉OK伴奏、人声与字幕的同步方法,在演唱者端进行人声、伴奏混音,加上播放的时间戳编码后发送到流媒体服务器;在收听者端,流媒体播放器线程启动后,首先从服务器端加载歌词,然后接收流媒体数据,采用接收到媒体数据量的大小来同步字幕的播放,从而实现收听者端与演唱者端卡拉OK伴奏、人声与字幕的同步。本发明减少网络带宽的实时传输,在接收者端多媒体播放线程启动前,从服务器上下载完字幕;同时降低CPU的计算消耗,在演唱者端将伴奏与人声进行混音、加上播放时间压缩编码形成多媒体数据块,接收者端进行解码播放,且按播放数据量的大小进行字幕同步。
-
公开(公告)号:CN103383699A
公开(公告)日:2013-11-06
申请号:CN201310270390.X
申请日:2013-06-28
申请人: 安徽科大讯飞信息科技股份有限公司
IPC分类号: G06F17/30
摘要: 本发明公开了一种字符串检索方法及系统,该方法包括:接收用户输入的检索信息;将所述检索信息中的字符串逐个字符进行拼音转换,并确定所述字符的相似发音集合;依次将所述字符的拼音及其相似发音集合中的相似发音进入多叉前缀树进行检索;在检索到与所述拼音或所述相似发音相匹配的节点时,将所述节点记录为激活状态,并记录激活路径,在下一个字符的拼音及其相似发音进入所述多叉前缀树后,对所有处于激活状态下的节点继续进行检索,直到检索到终止节点;获取所述激活路径上的终止节点保存的关键词信息;将所述关键词信息作为检索结果展现给所述用户。利用本发明,可以在保证容错能力下提高检索性能,降低运算量及对资源的占用率。
-
-
-
-
-
-
-
-
-