-
公开(公告)号:CN116798411A
公开(公告)日:2023-09-22
申请号:CN202210255889.2
申请日:2022-03-15
申请人: 清华大学 , 中国移动通信有限公司研究院 , 中国移动通信集团有限公司
IPC分类号: G10L15/06 , G10L15/02 , G10L19/038 , G10L25/30
摘要: 本发明公开了一种多语言训练方法、装置及存储介质,包括:通过神经网络获取音韵特征后,转化为以矢量编码的音素嵌入矢量,其中,将音韵特征编码为音韵矢量;获取声谱后,通过声学模型DNN提取声学特征;将音素嵌入矢量与声学特征进行内积后计算出音素的后验概率。采用本发明,避免了现有技术中训练音韵特征提取器的麻烦。使得跨语言zero‑shot的学习成为了可能,对于从未见过的音素,也能有较好的迁移效果。
-
公开(公告)号:CN116737885A
公开(公告)日:2023-09-12
申请号:CN202210199563.2
申请日:2022-03-02
申请人: 中国移动通信有限公司研究院 , 清华大学 , 中国移动通信集团有限公司
IPC分类号: G06F16/332 , G06F40/35
摘要: 本申请公开了一种信息处理方法、装置、设备和可读存储介质,涉及计算机技术领域,以提高端到端任务型对话系统的输出的准确性。该方法包括:获取用户的输入信息;将所述输入信息作为端到端任务型对话系统的输入,得到输出信息;其中,所述端到端任务型对话系统所采用的处理模型通过基于生成式预训练模型的有监督的预训练、并在预训练获得的模型基础上进行半监督训练获得。本申请实施例可以提高端到端任务型对话系统的输出的准确性。
-
公开(公告)号:CN112949255A
公开(公告)日:2021-06-11
申请号:CN201911267701.0
申请日:2019-12-11
申请人: 中国移动通信有限公司研究院 , 中国移动通信集团有限公司 , 清华大学
IPC分类号: G06F40/126 , G06F40/284 , G06F40/30 , G06F40/247
摘要: 本发明提供一种词向量训练方法及装置,该方法包括:对单词的初始化词向量的进行预训练,得到预训练词向量;使用语义融合的释义自编码器对所述预训练词向量进行训练,得到目标词向量;其中,所述语义融合的释义自编码器融合所述单词的语义关系和所述单词的词典释义;本发明实施例在语义融合的释义自编码器中融合语义关系和词典释义,显著提高词向量对语义相似性的建模能力;使用该语义融合的释义自编码器训练得到的目标词向量具有很强的普适性,且该词向量训练方法还具有训练时间短、资源消耗少等优势。
-
公开(公告)号:CN116910205A
公开(公告)日:2023-10-20
申请号:CN202310752628.6
申请日:2023-06-25
申请人: 中国移动通信集团有限公司研究院 , 清华大学
IPC分类号: G06F16/332 , G06F16/338 , G06N3/09 , G06N3/0895 , G06N5/04 , G06N3/0475
摘要: 本发明提供了模型训练方法、装置及系统,所述方法包括构建待训练的对话模型,待训练的对话模型包括生成模型、推断模型和检索模型;基于有标注的第一数据对待训练的对话模型中的推断模型和检索模型进行有监督的预训练,预训练后的推断模型用于根据第一数据中的用户输入数据和系统回复数据得到隐变量数据,预训练后的检索模型用于根据第一数据中的用户输入数据从数据库中检索得到查询结果;基于第一数据和无标注的第二数据形成的训练样本,对预训练后的对话模型进行半监督训练,得到训练好的对话模型,训练好的对话模型中生成模型用于生成对话动作数据和系统回复数据。提升了任务型对话任务中模型对于知识的结合能力,更加适用于知识型的任务。
-
公开(公告)号:CN118820410A
公开(公告)日:2024-10-22
申请号:CN202311736534.6
申请日:2023-12-18
申请人: 清华大学 , 中国移动通信集团有限公司研究院
IPC分类号: G06F16/332 , G06F16/31 , G06Q10/04 , G06N3/08 , G06F18/214
摘要: 本发明提供一种数据处理方法、任务预测方法、设备及介质,涉及人工智能领域,数据处理方法包括:获取第一任务的训练数据的第一特征向量;根据第一特征向量与任务提示信息集合中的任务提示信息的匹配度,确定任务提示信息集合中的第一目标任务提示信息;将第一特征向量与第一目标任务提示信息进行组合,得到第二特征向量;将第二特征向量输入预训练语言模型,得到第一任务的训练数据的预测结果;根据第一任务的训练数据的预测结果和第一任务的训练数据对应的标签,对任务提示信息集合进行调整,得到目标任务提示信息集合。本发明实施例,通过调节和使用任务提示信息集合,从而提高预训练语言模型预测的准确性。
-
公开(公告)号:CN116910204A
公开(公告)日:2023-10-20
申请号:CN202310746434.5
申请日:2023-06-25
申请人: 中国移动通信集团有限公司研究院 , 清华大学
IPC分类号: G06F16/332 , G06N3/09 , G06N3/04
摘要: 本申请提供一种对话模型训练方法、装置及相关设备,其中,方法包括使对话模型与目标用户仿真模型进行交互,获得交互结果;根据交互结果调整对话模型,获得调整后的对话模型;其中,目标用户仿真模型用于模仿在对话中用户的行为。本申请实施例提供的对话模型训练方法提高了对话模型的性能。
-
公开(公告)号:CN112464645A
公开(公告)日:2021-03-09
申请号:CN202011543169.3
申请日:2020-12-21
申请人: 中国电力科学研究院有限公司 , 清华大学 , 国家电网有限公司客户服务中心 , 国网浙江省电力有限公司营销服务中心 , 国家电网有限公司
IPC分类号: G06F40/211 , G06F40/30 , G06K9/62
摘要: 本发明提供一种半监督学习方法、系统、设备和存储介质及语义解析方法,设计合理,应用简单,在输出数据是离散变量的情况下,能够避免梯度传递的问题。所述方法包括,采用配对的输入数据集进行最大化条件似然的序列到序列学习,实现有监督学习;采用未配对的输入数据集基于联合随机近似进行学习,实现无监督学习;设定有监督学习目标和无监督学习目标的权重分配;按照权重分配将有监督学习目标和无监督学习目标联合为联合优化目标;根据联合优化目标,同时进行有监督学习和无监督学习。本发明将联合随机近似拓展到序列到序列半监督学习中,利用配对的数据集和未配对的输入数据集同时进行学习,提高了学习的效率和效果。
-
公开(公告)号:CN114969280A
公开(公告)日:2022-08-30
申请号:CN202210393967.5
申请日:2022-04-15
申请人: 清华大学
IPC分类号: G06F16/332 , G06N3/08
摘要: 本申请涉及一种对话生成方法及装置、对话预测模型的训练方法及装置。方法包括:在第t轮对话中,接收客户端发送的第t轮用户输入信息,其中,t为正整数;采用对话预测模型根据第t轮用户输入信息及第t‑1轮预测信息进行对话预测,得到第t轮系统回复信息,第t‑1轮预测信息包括第t‑1轮对话状态和第t‑1轮系统回复信息;向客户端反馈第t轮系统回复信息。采用本方法能够提高系统的数据处理效率,降低系统的响应时间,提高系统的响应效率,且可以提高预测效果。
-
公开(公告)号:CN109460450B
公开(公告)日:2021-07-09
申请号:CN201811131847.8
申请日:2018-09-27
申请人: 清华大学
IPC分类号: G06F16/332 , G06F16/35 , G06F16/36 , G06F40/289 , G06F40/30
摘要: 本申请涉及一种对话状态跟踪方法、装置、计算机设备和存储介质,通过获取当前轮对话文本,根据所述对话文本与富对话状态跟踪规则,确定当前轮对话语义,再根据所述对话语义与上一轮对话状态,更新当前轮对话状态。采用本方法能够提高对话的鲁棒性、一槽取多值以及表达用户对所取值的偏好。
-
公开(公告)号:CN101853262A
公开(公告)日:2010-10-06
申请号:CN200910241366.7
申请日:2009-12-07
申请人: 清华大学
IPC分类号: G06F17/30
摘要: 基于交叉熵的音频指纹快速搜索方法,属于音频指纹搜索技术领域,其特征在于,利用共分量高斯混合模型来描述音频指纹,并且用交叉熵来衡量音频指纹间的距离,然后用广义动态时序比对方法,以滑动窗方式将用户指定音频段与输入音频流进行指纹比较,判断该音频流中是否包含有指定音频段。本发明具有能大大地减少距离计算次数,而且还能适应于多种音频失真情况,错误率相对于使用L1距离降低了三分之一的优点,已完成软件实现并在仿真实验中予以测试。
-
-
-
-
-
-
-
-
-