-
公开(公告)号:CN113515611A
公开(公告)日:2021-10-19
申请号:CN202110695251.6
申请日:2021-06-22
申请人: 镁佳(北京)科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F40/117 , G06F40/30 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种任务型多意图对话的意图识别方法,其中方法包括:获取训练样本语料库;利用多任务模型对训练样本进行基本意图标注,并对其各个单字进行槽位标签标注和意图标签标注,得到标注结果;利用标注结果与训练样本的实际标签之间的误差,校正多任务模型,以通过校正后的多任务模型识别待检测文本的基本意图,并标注其单字槽位标签和单字意图标签,单字意图标签用于确定单字槽位标签与基本意图的归属关系,以通过单字槽位标签对各个基本意图进行准确意图识别。本发明提供的技术方案解决了任务型多意图对话中意图和槽位不能有效匹配的问题。
-
公开(公告)号:CN113515611B
公开(公告)日:2022-04-26
申请号:CN202110695251.6
申请日:2021-06-22
申请人: 镁佳(北京)科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F40/117 , G06F40/30 , G06N3/04 , G06N3/08
摘要: 本发明公开了一种任务型多意图对话的意图识别方法,其中方法包括:获取训练样本语料库;利用多任务模型对训练样本进行基本意图标注,并对其各个单字进行槽位标签标注和意图标签标注,得到标注结果;利用标注结果与训练样本的实际标签之间的误差,校正多任务模型,以通过校正后的多任务模型识别待检测文本的基本意图,并标注其单字槽位标签和单字意图标签,单字意图标签用于确定单字槽位标签与基本意图的归属关系,以通过单字槽位标签对各个基本意图进行准确意图识别。本发明提供的技术方案解决了任务型多意图对话中意图和槽位不能有效匹配的问题。
-
公开(公告)号:CN113343695B
公开(公告)日:2022-02-01
申请号:CN202110587910.4
申请日:2021-05-27
申请人: 镁佳(北京)科技有限公司
IPC分类号: G06F40/295 , G06F40/216 , G06F40/30 , G06N20/00
摘要: 本发明公开了一种文本标注噪声检测方法、装置、存储介质及电子设备,该方法包括:获取待训练模型的样本数据集;根据样本数据集采用K折交叉验证得到模型预测结果;基于模型预测结果的输出计算样本数据集中每个数据的信任度;根据信任度和信任度阈值的关系确定样本数据集的噪声文本。通过实施本发明,提出了信任度度量指标,通过对数据样本集中的数据进行信任度评估,根据阈值筛选出噪声文本,可以用于工程上的数据标注纠错。并且,由于该检测方法的检测过程与神经模型无关,无需对模型做任何改动;因此,该检测方法与概率估计和鲁棒性的方法相比,集成性强,简化了繁琐的工程步骤;能够提供灵活的信任度配置,检测过程及效果更加可控。
-
公开(公告)号:CN113343695A
公开(公告)日:2021-09-03
申请号:CN202110587910.4
申请日:2021-05-27
申请人: 镁佳(北京)科技有限公司
IPC分类号: G06F40/295 , G06F40/216 , G06F40/30 , G06N20/00
摘要: 本发明公开了一种文本标注噪声检测方法、装置、存储介质及电子设备,该方法包括:获取待训练模型的样本数据集;根据样本数据集采用K折交叉验证得到模型预测结果;基于模型预测结果的输出计算样本数据集中每个数据的信任度;根据信任度和信任度阈值的关系确定样本数据集的噪声文本。通过实施本发明,提出了信任度度量指标,通过对数据样本集中的数据进行信任度评估,根据阈值筛选出噪声文本,可以用于工程上的数据标注纠错。并且,由于该检测方法的检测过程与神经模型无关,无需对模型做任何改动;因此,该检测方法与概率估计和鲁棒性的方法相比,集成性强,简化了繁琐的工程步骤;能够提供灵活的信任度配置,检测过程及效果更加可控。
-
公开(公告)号:CN111353035A
公开(公告)日:2020-06-30
申请号:CN202010166023.5
申请日:2020-03-11
申请人: 镁佳(北京)科技有限公司
IPC分类号: G06F16/332 , G06F40/289 , G06F40/30 , G06F40/126 , G06N3/04 , G06N3/08
摘要: 本公开涉及一种人机对话方法、装置、可读存储介质及电子设备。方法包括:在接收到用户当前输入的文本信息后,从人机对话系统中读取第一对话状态;根据文本信息和第一对话状态,确定第二对话状态和文本信息对应的意图、领域、问题类型、第二槽值对;将第二槽值对与第二对话状态结合,得到当前对话状态;根据当前对话状态、意图、领域及问题类型对文本信息进行语义理解。由此,可对用户当前输入的文本信息的理解提供全面的信息支持,即使当前输入的文本信息采用基于上文的共指和省略,也可获取到正确执行命令必须的槽位,因而能准确高效地对用户当前输入的文本信息进行理解。并且,无需存储用户当前输入的文本信息的诸多上文信息,可节省存储空间。
-
公开(公告)号:CN115410544B
公开(公告)日:2024-01-30
申请号:CN202211037097.4
申请日:2022-08-26
申请人: 镁佳(北京)科技有限公司
IPC分类号: G10H1/00 , G06F16/683 , G06F16/65
摘要: 本发明公开了一种音效处理方法、装置及电子设备,包括:获取待处理歌曲对应的用于表征歌曲类型的文本信息;根据用于表征歌曲类型的文本信息和待处理歌曲的音频字节数组对待处理歌曲进行风格分类;根据风格分类结果利用预设音效决策方法确定待处理歌曲的风格音效;获取待处理歌曲的音频目标特征;根据待处理歌曲的音频目标特征进行音效补偿操作得到待处理歌曲的音频补偿音效;将待处理歌曲的属性信息、待处理歌曲的补偿音效以及待处理歌曲的风格音效进行关联存储。
-
公开(公告)号:CN115994211A
公开(公告)日:2023-04-21
申请号:CN202211646299.9
申请日:2022-12-19
申请人: 镁佳(北京)科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/30 , G06F18/214
摘要: 本发明公开了一种文本处理方法、装置、电子设备及存储介质,所述方法包括:响应于对语音文本的接收操作并根据接收到的语音文本以及历史语音文本确定当前对话场景是否为多轮对话场景;若当前对话场景为多轮对话场景,判断所述多轮对话场景中包含的语音文本内容是否存在缺失信息;若存在缺失信息,将多轮对话场景中包含的语音文本内容输入到预先训练好的文本处理模型中,使得所述文本处理模型对存在缺失信息的语音文本内容进行补全处理,所述文本处理模型包括指针网络模型,本发明通过对缺失信息的文本进行改写得到语义完整的语音文本,提升了智能对话的准确性。
-
公开(公告)号:CN115994211B
公开(公告)日:2024-03-08
申请号:CN202211646299.9
申请日:2022-12-19
申请人: 镁佳(北京)科技有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/30 , G06F18/214
-
公开(公告)号:CN115410544A
公开(公告)日:2022-11-29
申请号:CN202211037097.4
申请日:2022-08-26
申请人: 镁佳(北京)科技有限公司
IPC分类号: G10H1/00 , G06F16/683 , G06F16/65
摘要: 本发明公开了一种音效处理方法、装置及电子设备,包括:获取待处理歌曲对应的用于表征歌曲类型的文本信息;根据用于表征歌曲类型的文本信息和待处理歌曲的音频字节数组对待处理歌曲进行风格分类;根据风格分类结果利用预设音效决策方法确定待处理歌曲的风格音效;获取待处理歌曲的音频目标特征;根据待处理歌曲的音频目标特征进行音效补偿操作得到待处理歌曲的音频补偿音效;将待处理歌曲的属性信息、待处理歌曲的补偿音效以及待处理歌曲的风格音效进行关联存储。
-
公开(公告)号:CN115240709B
公开(公告)日:2023-09-19
申请号:CN202210879403.2
申请日:2022-07-25
申请人: 镁佳(北京)科技有限公司
摘要: 本发明提供了一种音频文件的声场分析方法及装置,其中,音频文件的声场分析方法包括:获取待识别音频文件;将待识别音频文件划分为若干音频数据,并对每一音频数据进行合成器含量计算,得到合成器含量计算结果;对待识别音频文件进行伴奏人声比计算,得到伴奏人声比计算结果;判断合成器含量计算结果是否满足合成器含量阈值,以及伴奏人声比计算结果是否满足伴奏人声比阈值;当合成器含量计算结果、伴奏人声比计算结果分别满足各自阈值时,判定待识别音频文件的声场属性为声场窄。在准确计算得到合成器含量以及伴奏人声比的同时,还可以将音频文件的空间感进行有效表征,进而通过音频文件的内在属性对音频文件的调节进行准确指导。
-
-
-
-
-
-
-
-
-