-
公开(公告)号:CN114242036A
公开(公告)日:2022-03-25
申请号:CN202111545651.5
申请日:2021-12-16
申请人: 云知声智能科技股份有限公司
IPC分类号: G10L13/047 , G10L13/08 , G10L13/04 , G10L25/51 , G06F16/65 , G06F16/901 , G06K9/62
摘要: 角色配音方法、装置、存储介质及电子设备,通过构建音色库、角色类型知识图谱、音色类型知识图谱和音色类型搭配知识图谱;将待配音作品根据配音场次进行划分,每个配音场次包括角色的对话文本、背景描述和旁白,并形成台本;通过角色类型知识图谱对台本中的角色进行角色类型匹配,确定台本中角色的角色类型;通过音色类型知识图谱对台本中的角色进行音色类型匹配,确定台本中角色的音色类型;通过音色类型搭配知识图谱对台本中角色的角色类型和音色类型进行搭配,确定台本中角色的配音方案。本发明为出品方节约大量时间、人力成本,快速完成作品角色配音;可实现作品音色快速切换,节省了返工的成本,最大程度保证了作品的竞争力和适应性。
-
公开(公告)号:CN114220421A
公开(公告)日:2022-03-22
申请号:CN202111547980.3
申请日:2021-12-16
申请人: 云知声智能科技股份有限公司
摘要: 本申请涉及一种字级别的时间戳的生成方法、电子设备和存储介质,该方法包括:在逐帧解码过程中,确定每个字的概率峰值;根据每个字的概率峰值确定每个字的尾端点对应的时间;根据每个字的尾端点对应的时间确定每个字的首端点对应的时间;根据每个字的首端点对应的时间和每个字的尾端点对应的时间生成字级别的时间戳。本申请通过基于深度神经网络的输出分数,以及解码过程中输出每个字时打分的变化规律,确定每个字的概率峰值,根据每个字的概率峰值确定每个字的首端点对应的时间和每个字的尾端点对应的时间,提供了获取字级别时间戳的方法,能够输出字级别上精确的时间戳信息,从而得到高精度的边界信息,提升了用户体验。
-
公开(公告)号:CN114219312A
公开(公告)日:2022-03-22
申请号:CN202111547989.4
申请日:2021-12-16
申请人: 云知声智能科技股份有限公司
摘要: 本申请涉及一种评价时间戳准确性的方法、装置、电子设备和存储介质,该方法包括:获取音频对应的识别文本结果以及音频对应的标注文本;匹配识别文本结果以及标注文本确定匹配字数;根据匹配字数和识别文本结果确定准确率;根据匹配字数和标注文本确定召回率;根据准确率和所述召回率确定F1‑score,F1‑score用于评价时间戳的准确性。本申请中首先评价时间戳的准确性通过识别文本与标注文本的匹配率来确定,将识别文本结果与标注文本的匹配率看作一个检索任务,借用检索任务中常用的准确率和召回率,以及把二者综合起来的调和平均数F1‑score来评价字级别时间戳的准确性,字可以是中文汉字,或者英文单词,最终实现对字级别时间戳的评价,改善了用户体验。
-
公开(公告)号:CN109461456B
公开(公告)日:2022-03-22
申请号:CN201811466502.8
申请日:2018-12-03
申请人: 云知声智能科技股份有限公司
发明人: 关海欣
IPC分类号: G10L21/0216 , G10L17/24 , G10L15/22 , G10L15/26
摘要: 本发明提供了一种提升语音唤醒成功率的方法,该方法用于提升对处于休眠状态的终端设备进行语音唤醒操作的成功率,该方法将原有的相对独立且互不联系的语音唤醒和麦克风阵列信号处理这两者进行有机结合,并通过关联该两者各自的信息以构建一个闭环反馈回路,该闭环反馈回路使得该语音唤醒为该麦克风阵列信号处理提供真实准确的信号数据区间,以使该麦克风阵列信号处理获得关于信号和噪声的准确统计量信息,这导致将去除干扰噪声的语音数据传送至唤醒引擎后即可得到精准快速的唤醒结果。
-
公开(公告)号:CN114171003A
公开(公告)日:2022-03-11
申请号:CN202111504145.1
申请日:2021-12-09
申请人: 云知声智能科技股份有限公司
IPC分类号: G10L15/01 , G06F40/205
摘要: 本申请涉及一种语音识别系统的重打分方法、装置、电子设备和存储介质,该方法包括:判断待识别语音对应的文本是长文本还是短文本;若判断结果为待识别语音是长文本,对长文本进行断句得到多个短文本;分别确定多个短文本中每个短文本的重打分结果;将每个短文本的重打分结果进行求和得到长文本的重打分结果。本申请通过在重打分阶段的即时解码过程中,来判断待识别语音对应的文本中的当前字是否是一个句子的结束,若当前字是一个句子的结束对长文本进行断句得到多个短文本,分别确定每个短文本重打分结果然后短文本重打分结果确定长文本的重打分结果,从而能够拿到更准确的语言模型打分,提高重打分的准确性,进而提升整个识别系统的识别率。
-
公开(公告)号:CN114155872A
公开(公告)日:2022-03-08
申请号:CN202111545638.X
申请日:2021-12-16
申请人: 云知声智能科技股份有限公司
IPC分类号: G10L21/0224
摘要: 本申请涉及一种单通道语音降噪方法、装置、电子设备和存储介质,该方法包括:获取待降噪语音;提取待降噪语音的特征后输入预先训练好的模型中得到每一帧语音的掩膜值;将每一帧语音的掩膜值与每一帧语音的掩膜值对应的修正离散余弦变换相乘,再进行修正离散余弦反变换,得到降噪后的每一帧语音;重叠相加降噪后的每一帧语音得到降噪语音。本申请通过修正离散余弦变换替代当前FFT复数谱,相比FFT的优点为,其一,FFT是复数,神经网络训练工具目前都不支持复数,需要手动设计网络,模型往往复杂度很高;其二,FFT变换参数多,以512点FFT为例,变换后实部、虚部一共512个参数,而512点MDCT,变换后仅256点,输入、输出参数减半,使得降噪更简单。
-
公开(公告)号:CN114139138A
公开(公告)日:2022-03-04
申请号:CN202111502132.0
申请日:2021-12-09
申请人: 云知声智能科技股份有限公司
摘要: 本发明公开了一种权限验证方法、装置、存储介质及电子装置。其中,该权限验证方法包括:获取访客申请的通行权限请求,其中,通行权限请求中携带用户的标识信息,用于请求设备的通行权限;在通行权限请求验证通过的情况下,向终端发送验证信息;在向终端发送验证信息失败的情况下,向终端发送通行二维码,以使终端通过二维码获取设备的通行权限,即可以通过正常云端通行权限数据下发和二维码通行实时校验的方式,可以在云端权限下发失败的时候,让用户具备通行权限,实现设备稳定运营,解决了现有技术中,设备出现故障后,无法有效的获取通行权限技术问题。
-
公开(公告)号:CN114120769A
公开(公告)日:2022-03-01
申请号:CN202111434663.0
申请日:2021-11-29
申请人: 云知声智能科技股份有限公司
摘要: 本发明公开了一种盲文阅读方法、装置、存储介质及电子装置。其中,该盲文阅读方法包括:获取放置在盲文书籍放置板上盲文书籍的盲文图像,其中,盲文图像对应盲文书籍中的一页盲文;提取盲文图像的凸点和空白信息,形成二进制的盲文凸点矩阵,其中,盲文凸点矩阵中1表示凸点,0表示空白信息;将盲文凸点矩阵翻译成拼音和标点符号,并根据拼音和标点符号翻译成汉字文本和标点符号,形成阅读文本;响应语音播报指令,播报阅读文本,即将盲文转化为语音,辅助盲人进行阅读,提升盲文阅读的速度和效率。进而解决了现有技术中,盲文阅读效率低的技术问题。
-
公开(公告)号:CN114090166A
公开(公告)日:2022-02-25
申请号:CN202111437179.3
申请日:2021-11-29
申请人: 云知声智能科技股份有限公司
摘要: 本发明涉及一种交互的方法和装置,该方法包括:启动mic进行拾音;当进入屏幕的首页时,编译与首页相关的首页免唤醒词,以定义所述首页免唤醒词在所述首页对应的功能;若所述首页免唤醒词被触发,则执行与所述首页免唤醒词相关的功能;若执行所述功能跳转到所述屏幕的二级页面,则编译与所述二级页面相关的二级免唤醒词,以定义所述二级免唤醒词在所述二级页面对应的功能;若所述二级免唤醒词被触发,则执行与所述二级免唤醒词相关的功能。通过在不同页面编译与该页面功能相关的免唤醒词,当免唤醒词被触发后执行与该免唤醒词相关联的功能,从而使用户和大屏交互更简单方便,增加用户体验。
-
公开(公告)号:CN110717392B
公开(公告)日:2022-02-18
申请号:CN201910838567.9
申请日:2019-09-05
申请人: 云知声智能科技股份有限公司
摘要: 本发明提供了一种坐姿检测与纠正方法和装置,该坐姿检测与纠正方法和装置能够集成应用到不同学习机设备中,这能够使得现有的学习机设备不仅能够用于训练儿童的学习能力,同时还能够对儿童的坐姿进行实时检测和纠正,从而提高儿童保持正常坐姿的意识和有效防止儿童在长期学习过程中受到不必要的健康损害;此外,该坐姿检测与纠正装置能够集成到小体积的学习机设备中,这便于儿童在不同时间和不同场合中检测和纠正自身的坐姿,从而提高该装置的便携性和对不同场合的适用性。
-
-
-
-
-
-
-
-
-