语音切割方法、语音转换网络模型的训练方法及相关设备

    公开(公告)号:CN111883104B

    公开(公告)日:2021-10-15

    申请号:CN202010650000.1

    申请日:2020-07-08

    IPC分类号: G10L13/08 G10L13/04 G10L13/10

    摘要: 本发明提供一种语音切割方法、语音转换网络模型的训练方法及相关设备,该方法包括:将目标文本输入至预先训练的语音转换网络模型中,得到与目标文本对应的目标语音;将目标文本和目标语音输入至编解码网络模型中得到时长数组,时长数组包括目标文本中各文本字符在目标语音占据的时长;根据时长数组对目标语音进行切割,得到目标文本中每一文本字符对应的语音。本发明实施例由于可以确定每一文本字符在目标语音中占据的时长,因此可以根据目标文本中每个文本字符占据的时长对目标语音进行切割,实现对目标语音的准确切割,进而保证合成语音的清晰度。

    数据标注方法以及相关装置

    公开(公告)号:CN111506776B

    公开(公告)日:2021-03-30

    申请号:CN201911088473.0

    申请日:2019-11-08

    IPC分类号: G06F16/901 G06F16/907

    摘要: 本申请公开了一种数据标注方法以及相关装置。其中,数据标注方法包括:将待标注数据输入层级标注系统,确定待标注数据的数据标签;若待标注数据在确定的数据标签所对应的子标签层中为非本类数据标签,则在与确定的数据标签位于同一层级的其他数据标签中查找满足预设条件的数据标签;若查找到满足预设条件的数据标签,则用满足预设条件的数据标签的子标签及满足预设条件的数据标签的子标签的上一层数据标签对应标注待标注数据的数据标签。上述方案,能够提高错误标注处理效率,提升数据标注质量。

    一种信息处理和模型训练方法、装置、设备及存储介质

    公开(公告)号:CN111883226A

    公开(公告)日:2020-11-03

    申请号:CN201911082412.3

    申请日:2019-11-07

    IPC分类号: G16H20/30 G06Q10/04

    摘要: 本发明公开了一种信息处理和模型训练方法、装置、设备及存储介质,涉及通信技术领域,以解决计步数据不准确的问题。该方法包括:在第一目标时间段内,检测终端设备的GPS信号;根据对所述GPS信号的检测结果,获取测试数据集,所述测试数据集包括所述终端设备的至少一个传感器的数据;对所述测试数据集进行预处理,得到特征数据集;根据所述特征数据集,运行预测模型,得到预测值;在所述预测值满足预设条件的情况下,停止更新计步数据;其中,所述计步数据是根据所述测试数据集确定的。本发明实施例可提高计步的准确性。

    语音切割方法、语音转换网络模型的训练方法及相关设备

    公开(公告)号:CN111883104A

    公开(公告)日:2020-11-03

    申请号:CN202010650000.1

    申请日:2020-07-08

    IPC分类号: G10L13/08 G10L13/04 G10L13/10

    摘要: 本发明提供一种语音切割方法、语音转换网络模型的训练方法及相关设备,该方法包括:将目标文本输入至预先训练的语音转换网络模型中,得到与目标文本对应的目标语音;将目标文本和目标语音输入至编解码网络模型中得到时长数组,时长数组包括目标文本中各文本字符在目标语音占据的时长;根据时长数组对目标语音进行切割,得到目标文本中每一文本字符对应的语音。本发明实施例由于可以确定每一文本字符在目标语音中占据的时长,因此可以根据目标文本中每个文本字符占据的时长对目标语音进行切割,实现对目标语音的准确切割,进而保证合成语音的清晰度。

    数据标注方法以及相关装置

    公开(公告)号:CN111506776A

    公开(公告)日:2020-08-07

    申请号:CN201911088473.0

    申请日:2019-11-08

    IPC分类号: G06F16/901 G06F16/907

    摘要: 本申请公开了一种数据标注方法以及相关装置。其中,数据标注方法包括:将待标注数据输入层级标注系统,确定待标注数据的数据标签;若待标注数据在确定的数据标签所对应的子标签层中为非本类数据标签,则在与确定的数据标签位于同一层级的其他数据标签中查找满足预设条件的数据标签;若查找到满足预设条件的数据标签,则用满足预设条件的数据标签的子标签及满足预设条件的数据标签的子标签的上一层数据标签对应标注待标注数据的数据标签。上述方案,能够提高错误标注处理效率,提升数据标注质量。

    数据标注方法以及相关装置

    公开(公告)号:CN111506554A

    公开(公告)日:2020-08-07

    申请号:CN201911089517.1

    申请日:2019-11-08

    IPC分类号: G06F16/21

    摘要: 本申请公开了一种数据标注方法以及相关装置。其中,数据标注方法包括:将待标注数据输入层级标注系统,确定待标注数据在层级标注系统中推荐的数据标签;其中,层级标注系统每一层包含至少一个数据标签,每个数据标签包含至少一个子标签,和/或,每个数据标签包含一个父标签;层级标注系统包括推荐模型,推荐的数据标签是通过推荐模型推荐得到的;基于待标注数据在层级标注系统中推荐的数据标签,确定待标注数据所属的数据标签的子标签;根据确定的子标签更新待标注数据的当前数据标签。上述方案,能够提高数据标注的效率和质量。

    语音转换方法、装置及服务器

    公开(公告)号:CN111883100B

    公开(公告)日:2021-11-09

    申请号:CN202010709138.4

    申请日:2020-07-22

    摘要: 本发明提供一种语音转换方法、装置及服务器,该方法包括:按照预设规则将目标文本划分为L个目标字符串,L个目标字符串包括N个第一字符串;对N个第一字符串进行语音转换,获得N个第一语音片段;基于第一基频和第二基频对相邻两个第一字符串对应的第一语音片段进行音频调整,第一基频为相邻两个第一字符串中顺序在先的第一字符串的最后一个字符对应的基频,第二基频为相邻两个第一字符串中顺序在后的第一字符串的第一个字符对应的基频;将目标语音片段进行拼接得到目标文本的语音,目标语音片段包括N个第一语音片段进行音频调整后的语音片段。本发明解决了语音拼接过程中产生上下文韵律衔接不一致,从而导致合成的语音的声音效果较差的问题。

    一种分类模糊性分析方法及装置

    公开(公告)号:CN111881287B

    公开(公告)日:2021-08-17

    申请号:CN201910852791.3

    申请日:2019-09-10

    IPC分类号: G06F16/35

    摘要: 本发明提供一种分类模糊性分析方法及装置,该方法包括:将知识库中的N条语料输入分类模型,得到所述N条语料中每条语料对应的L个分类的概率;分别根据所述每条语料对应的L个分类的概率,确定所述每条语料对应的M个分类;分别将所述每条语料对应的M个分类中每两个分类组成分类数据对;分别确定每个所述分类数据对的第一模糊相关系数;根据全部所述分类数据对的第一模糊相关系数,计算K个分类中每个分类的模糊性指标。通过本发明提供的分类模糊性分析方法,不仅可以提高知识库分类的模糊性分析的客观性,使得所得到的分析结果的可靠性更强,还可提高知识库分类的模糊性分析的效率。

    深度学习模型的压缩方法、装置、设备及存储介质

    公开(公告)号:CN112825152A

    公开(公告)日:2021-05-21

    申请号:CN201911144297.8

    申请日:2019-11-20

    IPC分类号: G06N3/04 G06N3/08

    摘要: 本申请提供一种深度学习模型的压缩方法、装置、设备及存储介质;其中,该压缩方法包括将预先训练完成的初始深度学习模型中部分图节点的原始格式修改为预设格式;将格式为预设格式的图节点的数据类型由浮点型数据转换成整型数据,以压缩初始深度学习模型。从而不仅能够提升运算速率,减小模型体积,且不会对模型的预测效果产生影响。

    一种实体识别方法、模型训练方法及装置

    公开(公告)号:CN112818689A

    公开(公告)日:2021-05-18

    申请号:CN201911118481.5

    申请日:2019-11-15

    摘要: 本发明提供一种实体识别方法、模型训练方法及装置,该实体识别方法包括:获取待识别的目标文本;确定所述目标文本对应的第一场景;从预先训练的至少两个实体识别模型中获取与所述第一场景对应的实体识别模型,其中,所述至少两个实体识别模型中不同的实体识别模型为基于不同场景的语料训练得到的;将所述目标文本输入与所述第一场景对应的实体识别模型中,得到所述目标文本的实体识别结果。通过本发明提供的实体识别方法,可以提高实体识别的准确率。