-
公开(公告)号:CN109741731B
公开(公告)日:2020-12-29
申请号:CN201910015434.1
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
Abstract: 本发明提供一种语种训练数据获得方法及装置,用以解决相关技术中语种训练数据质量较低的问题。该方法包括:训练用于识别各种语种的语种识别模型;使用各语种识别模型识别数据集中的第二音频数据,获得与各语种识别模型对应的得分;确定第二音频数据对应的识别语种;计算数据集中各条第二音频数据的得分信息熵;将所述数据集中,得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集,训练数据集中的第二音频数据用于训练所述语种识别模型,返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤,直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。
-
公开(公告)号:CN109741731A
公开(公告)日:2019-05-10
申请号:CN201910015434.1
申请日:2019-01-08
Applicant: 国家计算机网络与信息安全管理中心 , 清华大学
Abstract: 本发明提供一种语种训练数据获得方法及装置,用以解决相关技术中语种训练数据质量较低的问题。该方法包括:训练用于识别各种语种的语种识别模型;使用各语种识别模型识别数据集中的第二音频数据,获得与各语种识别模型对应的得分;确定第二音频数据对应的识别语种;计算数据集中各条第二音频数据的得分信息熵;将所述数据集中,得分信息熵满足第一预设条件且实际语种与识别语种一致的第二音频数据的集合作为训练数据集,训练数据集中的第二音频数据用于训练所述语种识别模型,返回执行所述使用训练数据训练用于识别语种的各语种识别模型的步骤,直至获得的所述训练数据集中的音频数据的数量满足第二预设条件。本发明提高了语种训练数据的质量。
-
公开(公告)号:CN112580367B
公开(公告)日:2023-10-27
申请号:CN202011538859.X
申请日:2020-12-23
Applicant: 潍柴动力股份有限公司 , 清华大学
IPC: G06F40/35 , G06N3/0455 , G06N3/0442 , G06N3/08 , G06Q10/0639 , G06Q30/012 , G10L15/22
Abstract: 本发明公开了一种话务质检方法及装置,可以获得客户与客服的通话音频数据,对通话音频数据进行语音识别,获得至少一条对话文本,对话文本包括客户部分文本和客服部分文本,将一条对话文本输入至训练好的语义向量提取器中,获得语义向量提取器输出的客户文本语义向量和客服文本语义向量,将客户文本语义向量和客服文本语义向量进行拼接,获得上下文相关语义向量,将获得的上下文相关语义向量输入至训练好的话务质检模型中,获得话务质检模型输出的一条对话文本的话务质检结果。本发明可以对所有的待检话务工单进行全面质检,有效提高质检效率,避免对质检人员的人力消耗,避免对质检不合格话务工单的遗漏。
-
公开(公告)号:CN112580367A
公开(公告)日:2021-03-30
申请号:CN202011538859.X
申请日:2020-12-23
Applicant: 潍柴动力股份有限公司 , 清华大学
Abstract: 本发明公开了一种话务质检方法及装置,可以获得客户与客服的通话音频数据,对通话音频数据进行语音识别,获得至少一条对话文本,对话文本包括客户部分文本和客服部分文本,将一条对话文本输入至训练好的语义向量提取器中,获得语音向量提取器输出的客户文本语义向量和客服文本语义向量,将客户文本语义向量和客服文本语义向量进行拼接,获得上下文相关语义向量,将获得的上下文相关语义向量输入至训练好的话务质检模型中,获得话务质检模型输出的一条对话文本的话务质检结果。本发明可以对所有的待检话务工单进行全面质检,有效提高质检效率,避免对质检人员的人力消耗,避免对质检不合格话务工单的遗漏。
-
公开(公告)号:CN113593606B
公开(公告)日:2022-02-15
申请号:CN202111156129.8
申请日:2021-09-30
Applicant: 清华大学
Abstract: 本申请涉及一种音频识别方法和装置、计算机设备、计算机可读存储介质。所述方法包括:获取音频数据对应的音频特征。从预设的异构关系图中获取异构关系特征,预设的异构关系图用于表示训练集中音频数据对应的标签之间的关系;标签之间的关系包括场景标签与场景标签之间的关系、事件标签与事件标签之间的关系、场景标签与事件标签之间的关系。预设的异构关系图为基于将初始异构关系图输入至预设的R‑GCN关系图卷积神经网络所生成的。将音频特征及异构关系特征输入至预设的深度神经网络中进行音频识别,生成与音频数据对应的场景标签及事件标签。采用本方法能够同时进行音频中场景和事件的双重识别分类任务,并且提高识别分类的准确度和可信度。
-
公开(公告)号:CN113593606A
公开(公告)日:2021-11-02
申请号:CN202111156129.8
申请日:2021-09-30
Applicant: 清华大学
Abstract: 本申请涉及一种音频识别方法和装置、计算机设备、计算机可读存储介质。所述方法包括:获取音频数据对应的音频特征。从预设的异构关系图中获取异构关系特征,预设的异构关系图用于表示训练集中音频数据对应的标签之间的关系;标签之间的关系包括场景标签与场景标签之间的关系、事件标签与事件标签之间的关系、场景标签与事件标签之间的关系。预设的异构关系图为基于将初始异构关系图输入至预设的R‑GCN关系图卷积神经网络所生成的。将音频特征及异构关系特征输入至预设的深度神经网络中进行音频识别,生成与音频数据对应的场景标签及事件标签。采用本方法能够同时进行音频中场景和事件的双重识别分类任务,并且提高识别分类的准确度和可信度。
-
公开(公告)号:CN118433767A
公开(公告)日:2024-08-02
申请号:CN202410531920.X
申请日:2024-04-29
Applicant: 清华大学
Abstract: 本发明提供一种无线电信网络评价方法、装置、电子设备及介质,涉及通信技术领域。该方法包括:获取目标小区及目标小区中的所有用户;对目标小区中的每个用户与小区基站的距离进行度量得到第一指标;对目标小区中的每个用户与小区基站的交互频率进行度量得到第二指标;基于第一指标和第二指标对目标小区的用户进行分组得到多个用户组;根据每个用户所属用户组所对应的服务等级目标值计算出以用户为评价对象的第一预期用户不满意数;根据每个用户组的用户数量和第一预期用户不满意数计算出以目标小区为评价对象的第二预期用户不满意数,并应用第二预期用户不满意数评价待评价无线电信网络。本发明的方案基于用户分组实现对网络可靠性的准确评价。
-
-
-
-
-
-