模型训练及语音生成方法、装置、设备及存储介质

    公开(公告)号:CN117423329A

    公开(公告)日:2024-01-19

    申请号:CN202311746255.8

    申请日:2023-12-19

    IPC分类号: G10L13/027

    摘要: 本公开实施例公开了一种模型训练及语音生成方法、装置、设备及存储介质。该方法包括:获取初始生成模型,初始生成模型为经过预训练的条件扩散模型;获取用户数据,用户数据包括用于反映目标人物特性的文本语音对数据;将初始生成模型作为待训练模型,并基于用户数据,调整待训练模型的激活函数,得到目标模型,目标模型用于语音生成。

    一种多用途数字人的控制系统及方法

    公开(公告)号:CN117076755A

    公开(公告)日:2023-11-17

    申请号:CN202311330811.3

    申请日:2023-10-16

    摘要: 本发明提供了一种多用途数字人的控制系统及方法,该系统包括:数字人身份数据保护模块、数字人交互内容生成模块、数字人上线发布模块及中央控制模块,所述数字人身份数据保护模块、数字人交互内容生成模块及数字人上线发布模块电性连接所述中央控制模,数字人身份数据保护模块用于对数字人的身份数据进行存储,数字人交互内容生成模块用于生成数字人的语音、唇动及动作信息,数字人上线发布模块用于将数字人以不同的载体模型进行发布。本发明提供的多用途数字人的控制系统及方法,能够实现多用途数字人的控制,便于使用。

    一种基于文本生成的智能填单方法

    公开(公告)号:CN116776840A

    公开(公告)日:2023-09-19

    申请号:CN202311048451.8

    申请日:2023-08-21

    发明人: 王丙栋 游世学

    摘要: 本发明提供了一种基于文本生成的智能填单方法,包括:拼接当前轮对话内容得到当前交互文本;使用神经网络编码器得到当前轮对应的表单项;构造当前轮对应的表单项的表单生成指示;将表单生成指示作为神经网络解码器的初始输出,得到下一轮对应的表单项;根据下一轮对应的表单项更新当前轮对应的表单状态文本,得到下一轮对应的表单状态文本;基于下一轮对应的表单状态文本,对前轮对应的历史操作文本进行更新,得到下一轮的历史文本。本发明解决了现有技术中在智能填单的多轮交互的过程中,丢弃较早的历史数据,只考虑最近几轮的对话数据导致生成的表单内容不准确的问题。

    一种文本分类系统及其训练方法

    公开(公告)号:CN111061872B

    公开(公告)日:2023-08-04

    申请号:CN201911170926.4

    申请日:2019-11-26

    发明人: 王丙栋 游世学

    摘要: 本发明公布了一种文本分类系统及其训练方法,所述系统包含以下模块:文本切分模块、文本编码器、文本标签注意力分类器。本发明的文本分类神经网络,使用相同的编码器对文本和标签编码,再使用注意力机制得到文本对每个标签的注意力,归一化注意力得到文本属于标签的概率。本发明的神经网络支持对可变数量标签的分类,具有标签可扩展、模型易迁移的特点。

    一种复合实体提取方法及系统
    26.
    发明公开

    公开(公告)号:CN111639499A

    公开(公告)日:2020-09-08

    申请号:CN202010484708.4

    申请日:2020-06-01

    IPC分类号: G06F40/295

    摘要: 本发明公开了一种复合实体提取方法及系统,所述方法包括:确定复合实体的依赖实体组;确定复合实体的表达式组;从目标文本依次提取依赖实体组,得到依赖实体命中词;对依赖实体命中词进行组合,生成候选依赖词组;根据候选依赖词组中各个词在文本中的位置过滤候选依赖词组;根据候选依赖词组分割目标文本,生成文本片段组;匹配表达式组和文本片段组,根据匹配结果提取出复合实体的命中词。本发明提供的复合实体提取方法及系统,能够利用提取出的简单实体的命中词,从文本中提取出复合实体的命中词,有利于提高复合实体的识别效果。

    一种文本重构训练方法及系统

    公开(公告)号:CN111639477A

    公开(公告)日:2020-09-08

    申请号:CN202010484716.9

    申请日:2020-06-01

    发明人: 王丙栋 游世学

    摘要: 本发明公开了一种文本重构训练方法及系统,所述方法包括:构建训练样本;采用神经网络文本序列模型,对原始文本和发音序列的拼接进行编码;采用sigmoid前馈神经网络分类器,获取分词分类结果;以预设的GEN_LENGTH为最大生成序列长度,从头至尾循环生成序列的每一位字符;神经网络参数的优化,计算分词损失和文本生成损失,生成损失加权求和,得到联合损失,对联合损失使用梯度下降算法优化神经网络的参数。本发明提供的文本重构训练方法及系统,使用文本编码和生成神经网络,将给定的原始文本转换成目标文本,纠正原始文本中的错别字,补充缺漏的字,去除多余的字,并规范用词,以达到消除文本错误提高文本质量的目的。

    一种短文本聚类方法、装置、电子设备及存储介质

    公开(公告)号:CN110990568A

    公开(公告)日:2020-04-10

    申请号:CN201911170820.4

    申请日:2019-11-26

    IPC分类号: G06F16/35 G06F40/126

    摘要: 本发明提供一种短文本聚类方法,包括确定当前待聚类目标;从聚类算法库中按照顺序选取初始聚类算法,以初始聚类算法作为当前聚类算法;基于当前聚类算法对当前待聚类目标进行聚类分析以得到当前聚类结果;对当前聚类结果进行过滤以得到过滤结果;记录过滤成功的结果,并以过滤失败的结果作为待聚类目标;若待聚类目标为非空值,则按照预设聚类顺序从聚类算法库中选取下一种聚类算法,若选取的下一种聚类算法为非空值,则以下一种聚类算法作为当前聚类算法,以待聚类目标作为当前待聚类目标,重复执行步骤:基于当前聚类算法对当前待聚类目标进行聚类分析以得到当前聚类结果。本方法具有适用性强、准确率高、能处理大量数据、速度快等优点。

    一种云机器人系统
    29.
    发明授权

    公开(公告)号:CN106393114B

    公开(公告)日:2019-03-01

    申请号:CN201611011081.0

    申请日:2016-11-17

    IPC分类号: B25J9/16

    摘要: 本发明公开了一种云机器人系统,包括云服务器平台和实体机器人,所述云服务器平台包括云机器人引擎模块和云编程引擎模块,所述云编程引擎模块在云服务器平台与所述云机器人引擎模块进行信号传输,所述实体机器人以云服务方式与所述云机器人引擎模块进行信号传输,所述实体机器人包括多个硬件功能模组,所述硬件功能模组遵循硬件功能模组标准,所述硬件功能模组标准使硬件功能模组在云服务方式下能够注册和添加。本发明云机器人系统降低了机器人的硬件成本,提高了系统的复用性和可维护性,利于机器人在熟悉场景下快速的调用和处理命令做出执行动作,保证了机器人智能化服务的丰富性。