专利检索 ap:("中国移动通信集团有限公司研究院" OR "清华大学") AND inv:"欧智坚" 第 1 页

1.

发明公开
一种模型训练方法、装置及系统审中-公开

公开(公告)号：CN116910205A

公开(公告)日：2023-10-20

申请号：CN202310752628.6

申请日：2023-06-25

申请人： 中国移动通信集团有限公司研究院 , 清华大学

发明人： 黄毅 , 欧智坚 , 冯俊兰 , 蔡予诚 , 刘红 , 金镝

IPC分类号： G06F16/332 , G06F16/338 , G06N3/09 , G06N3/0895 , G06N5/04 , G06N3/0475

摘要： 本发明提供了模型训练方法、装置及系统，所述方法包括构建待训练的对话模型，待训练的对话模型包括生成模型、推断模型和检索模型；基于有标注的第一数据对待训练的对话模型中的推断模型和检索模型进行有监督的预训练，预训练后的推断模型用于根据第一数据中的用户输入数据和系统回复数据得到隐变量数据，预训练后的检索模型用于根据第一数据中的用户输入数据从数据库中检索得到查询结果；基于第一数据和无标注的第二数据形成的训练样本，对预训练后的对话模型进行半监督训练，得到训练好的对话模型，训练好的对话模型中生成模型用于生成对话动作数据和系统回复数据。提升了任务型对话任务中模型对于知识的结合能力，更加适用于知识型的任务。

2.

发明公开
数据处理方法、任务预测方法、设备及介质审中-公开

公开(公告)号：CN118820410A

公开(公告)日：2024-10-22

申请号：CN202311736534.6

申请日：2023-12-18

申请人： 清华大学 , 中国移动通信集团有限公司研究院

发明人： 欧智坚 , 黄毅 , 周源 , 冯俊兰

IPC分类号： G06F16/332 , G06F16/31 , G06Q10/04 , G06N3/08 , G06F18/214

摘要： 本发明提供一种数据处理方法、任务预测方法、设备及介质，涉及人工智能领域，数据处理方法包括：获取第一任务的训练数据的第一特征向量；根据第一特征向量与任务提示信息集合中的任务提示信息的匹配度，确定任务提示信息集合中的第一目标任务提示信息；将第一特征向量与第一目标任务提示信息进行组合，得到第二特征向量；将第二特征向量输入预训练语言模型，得到第一任务的训练数据的预测结果；根据第一任务的训练数据的预测结果和第一任务的训练数据对应的标签，对任务提示信息集合进行调整，得到目标任务提示信息集合。本发明实施例，通过调节和使用任务提示信息集合，从而提高预训练语言模型预测的准确性。

3.

发明公开
对话模型训练方法、装置及相关设备审中-公开

公开(公告)号：CN116910204A

公开(公告)日：2023-10-20

申请号：CN202310746434.5

申请日：2023-06-25

申请人： 中国移动通信集团有限公司研究院 , 清华大学

发明人： 黄毅 , 欧智坚 , 刘红 , 冯俊兰

IPC分类号： G06F16/332 , G06N3/09 , G06N3/04

摘要： 本申请提供一种对话模型训练方法、装置及相关设备，其中，方法包括使对话模型与目标用户仿真模型进行交互，获得交互结果；根据交互结果调整对话模型，获得调整后的对话模型；其中，目标用户仿真模型用于模仿在对话中用户的行为。本申请实施例提供的对话模型训练方法提高了对话模型的性能。

4.

发明公开
一种半监督学习方法、系统、设备和存储介质及语义解析方法无效

公开(公告)号：CN112464645A

公开(公告)日：2021-03-09

申请号：CN202011543169.3

申请日：2020-12-21

申请人： 中国电力科学研究院有限公司 , 清华大学 , 国家电网有限公司客户服务中心 , 国网浙江省电力有限公司营销服务中心 , 国家电网有限公司

发明人： 谈元鹏 , 欧智坚 , 徐会芳 , 彭国政 , 胡若云 , 杜文勇 , 邓志东 , 宋运福

IPC分类号： G06F40/211 , G06F40/30 , G06K9/62

摘要： 本发明提供一种半监督学习方法、系统、设备和存储介质及语义解析方法，设计合理，应用简单，在输出数据是离散变量的情况下，能够避免梯度传递的问题。所述方法包括，采用配对的输入数据集进行最大化条件似然的序列到序列学习，实现有监督学习；采用未配对的输入数据集基于联合随机近似进行学习，实现无监督学习；设定有监督学习目标和无监督学习目标的权重分配；按照权重分配将有监督学习目标和无监督学习目标联合为联合优化目标；根据联合优化目标，同时进行有监督学习和无监督学习。本发明将联合随机近似拓展到序列到序列半监督学习中，利用配对的数据集和未配对的输入数据集同时进行学习，提高了学习的效率和效果。

5.

发明公开
对话生成方法及装置、对话预测模型的训练方法及装置审中-实审

公开(公告)号：CN114969280A

公开(公告)日：2022-08-30

申请号：CN202210393967.5

申请日：2022-04-15

申请人： 清华大学

发明人： 欧智坚 , 刘红

IPC分类号： G06F16/332 , G06N3/08

摘要： 本申请涉及一种对话生成方法及装置、对话预测模型的训练方法及装置。方法包括：在第t轮对话中，接收客户端发送的第t轮用户输入信息，其中，t为正整数；采用对话预测模型根据第t轮用户输入信息及第t‑1轮预测信息进行对话预测，得到第t轮系统回复信息，第t‑1轮预测信息包括第t‑1轮对话状态和第t‑1轮系统回复信息；向客户端反馈第t轮系统回复信息。采用本方法能够提高系统的数据处理效率，降低系统的响应时间，提高系统的响应效率，且可以提高预测效果。

6.

发明授权
对话状态跟踪方法、装置、计算机设备和存储介质有权

公开(公告)号：CN109460450B

公开(公告)日：2021-07-09

申请号：CN201811131847.8

申请日：2018-09-27

申请人： 清华大学

发明人： 欧智坚 , 戴音培 , 张毅

IPC分类号： G06F16/332 , G06F16/35 , G06F16/36 , G06F40/289 , G06F40/30

摘要： 本申请涉及一种对话状态跟踪方法、装置、计算机设备和存储介质，通过获取当前轮对话文本，根据所述对话文本与富对话状态跟踪规则，确定当前轮对话语义，再根据所述对话语义与上一轮对话状态，更新当前轮对话状态。采用本方法能够提高对话的鲁棒性、一槽取多值以及表达用户对所取值的偏好。

7.

发明公开
基于交叉熵的音频指纹快速搜索方法无效

公开(公告)号：CN101853262A

公开(公告)日：2010-10-06

申请号：CN200910241366.7

申请日：2009-12-07

申请人： 清华大学

发明人： 欧智坚 , 林晖

IPC分类号： G06F17/30

摘要： 基于交叉熵的音频指纹快速搜索方法，属于音频指纹搜索技术领域，其特征在于，利用共分量高斯混合模型来描述音频指纹，并且用交叉熵来衡量音频指纹间的距离，然后用广义动态时序比对方法，以滑动窗方式将用户指定音频段与输入音频流进行指纹比较，判断该音频流中是否包含有指定音频段。本发明具有能大大地减少距离计算次数，而且还能适应于多种音频失真情况，错误率相对于使用L1距离降低了三分之一的优点，已完成软件实现并在仿真实验中予以测试。

8.

发明公开
语音识别方法、装置、计算机设备和存储介质审中-实审

公开(公告)号：CN115312043A

公开(公告)日：2022-11-08

申请号：CN202210831799.3

申请日：2022-07-15

申请人： 清华大学

发明人： 欧智坚 , 安柯宇

IPC分类号： G10L15/16 , G10L15/26

摘要： 本申请涉及一种语音识别方法、装置、计算机设备和存储介质。所述方法包括：获取待识别语音的当前帧和当前帧之前的历史帧，并将当前帧和当前帧之前的历史帧作为第一分块，进而根据第一分块和目标合成预测器，模拟出第一分块对应的未来帧，从而根据第一分块、未来帧和目标声学模型，确定待识别语音的语音识别结果。采用本方法能够降低识别的延迟时间。

9.

发明授权
一种端到端的对话方法和系统有权

公开(公告)号：CN111694934B

公开(公告)日：2024-07-19

申请号：CN202010330720.X

申请日：2020-04-24

申请人： 中国电力科学研究院有限公司 , 清华大学 , 国网浙江省电力有限公司电力科学研究院 , 国家电网有限公司客户服务中心 , 国家电网有限公司

发明人： 欧智坚 , 张亦弛 , 谈元鹏 , 彭国政 , 武亚光 , 王正国 , 马永波 , 徐会芳 , 江俊军 , 孙钢 , 刘旭生

IPC分类号： G06F16/332 , G06F16/35 , G06F40/289 , G06F40/205 , G06F40/126

摘要： 本发明提供了一种端到端的对话方法，包括：获取当前用户语言、上轮系统回复语言和上轮对话状态表示；对所述当前用户语言和上轮系统回复语言进行分词处理；基于每个分词和所述上轮对话状态表示，得到至少指示一个对话领域的当前对话状态表示；基于每个对话领域的对话状态表示，从历史信息中查询符合要求的实体，得到当前用户语言对应的回复信息表示；基于所述当前用户语言、所述当前对话状态表示和所述回复信息表示，得到涵盖所述用户语言相关的所有领域的系统回复语言，本发明方法采用了指示对话领域的对话状态表示，可以很好地处理多领域对话任务，避免了因使用领域分类模型对领域检测而造成的新噪声引入，提升了系统性能。

10.

发明公开
一种多语言训练方法、装置及存储介质审中-实审

公开(公告)号：CN116798411A

公开(公告)日：2023-09-22

申请号：CN202210255889.2

申请日：2022-03-15

申请人： 清华大学 , 中国移动通信有限公司研究院 , 中国移动通信集团有限公司

发明人： 欧智坚 , 黄毅 , 朱程睿 , 冯俊兰 , 金镝

IPC分类号： G10L15/06 , G10L15/02 , G10L19/038 , G10L25/30

摘要： 本发明公开了一种多语言训练方法、装置及存储介质，包括：通过神经网络获取音韵特征后，转化为以矢量编码的音素嵌入矢量，其中，将音韵特征编码为音韵矢量；获取声谱后，通过声学模型DNN提取声学特征；将音素嵌入矢量与声学特征进行内积后计算出音素的后验概率。采用本发明，避免了现有技术中训练音韵特征提取器的麻烦。使得跨语言zero‑shot的学习成为了可能，对于从未见过的音素，也能有较好的迁移效果。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类