Patent search ap:("海尔优家智能科技(北京)有限公司" OR "青岛海尔科技有限公司" OR "海尔智家股份有限公司") AND inv:"栾天祥" Page 1

1.

发明公开
基于多模态融合的语义拒识方法及装置、存储介质审中-实审

公开(公告)号：CN118645093A

公开(公告)日：2024-09-13

申请号：CN202410863023.9

申请日：2024-06-28

Applicant: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 青岛海尔智能家电科技有限公司 , 海尔智家股份有限公司

Inventor： 段全盛 , 湛志强 , 栾天祥 , 田云龙 , 王淼 , 牛丽

IPC: G10L15/18 , G10L15/26 , G10L15/06

Abstract: 本申请公开了一种基于多模态融合的语义拒识方法及装置、存储介质，涉及智慧家庭技术领域，该基于多模态融合的语义拒识方法包括：根据目标对象的第一语音和所述第一语音允许被分配的第一标签，确定所述第一语音对应的第一语义信息表示；并通过图像编码器确定第一图像对应的第一语境信息表示；其中，所述第一图像是在所述目标对象发出所述第一语音的情况下，所述目标对象所处环境的图像；通过目标对齐算法对所述第一语义信息表示和所述第一语境信息表示进行对齐，得到第一对齐结果；根据所述第一对齐结果构造对所述第一语音的语义拒识策略。采用上述技术方案，解决了基于单文本数据的语义拒识模型的拒识效果差的问题。

2.

发明公开
基于多模态数据的烹饪辅助方法、存储介质及电子装置审中-实审

公开(公告)号：CN118113887A

公开(公告)日：2024-05-31

申请号：CN202211513328.4

申请日：2022-11-29

Applicant: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 海尔智家股份有限公司

Inventor： 魏玉琼 , 王凯 , 栾天祥 , 王迪

IPC: G06F16/432 , G06F16/332

Abstract: 本申请公开了一种基于多模态数据的烹饪辅助方法、存储介质及电子装置，涉及智慧家庭技术领域，该基于多模态数据的烹饪辅助方法包括：获取多模态数据，所述多模态数据包括语音数据和图像数据；根据所述语音数据确定烹饪询问意图；在所述烹饪询问意图为菜品询问意图的情况下，根据所述图像数据确定菜品图像信息；根据所述烹菜品询问意图和所述菜品图像信息确定烹饪辅助信息。通过结合菜品询问意图以及菜品图像信息充分了解用户要解决的关于烹饪菜品的问题，根据菜品询问意图和菜品图像信息提供全面准确的烹饪辅助，并将烹饪辅助信息推送至预设智能终端进行播放，提升用户体验。

3.

发明公开
文本转语音方法及装置审中-实审

公开(公告)号：CN119091852A

公开(公告)日：2024-12-06

申请号：CN202411279443.9

申请日：2024-09-12

Applicant: 青岛海尔科技有限公司 , 青岛海尔智能家电科技有限公司 , 海尔优家智能科技(北京)有限公司 , 海尔智家股份有限公司

Inventor： 田云龙 , 杜永杰 , 邓邱伟 , 崔原 , 栾天祥 , 牛丽

IPC: G10L13/02 , G10L13/08 , G10L15/06 , G10L25/30

Abstract: 本公开涉及智能家居和智慧家庭的技术领域，公开了一种文本转语音方法及装置，方法包括：获取语料库中的每个单位对象的重要程度值，其中，重要程度值是用来衡量单位对象在语料库中的相对重要性的量化指标；基于每个单位对象的重要程度值对语料库进行压缩，基于压缩后的语料库对文本转语音模型进行训练，其中，文本转语音模型为非自回归模型；将待转换的目标文本输入到训练好的文本转语音模型，利用文本转语音模型输出相应的语音。基于压缩后的语料库对文本转语音模型进行训练，有助于降低模型训练成本，还可以确保文本转语音模型具有较高的准确性，实现了兼顾文本转语音模型较高的准确性和降低模型训练成本这两方面的需求。

4.

发明公开
多媒体项目的播放方法和装置、存储介质及电子装置审中-实审

公开(公告)号：CN117676246A

公开(公告)日：2024-03-08

申请号：CN202211049029.X

申请日：2022-08-30

Applicant: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 海尔智家股份有限公司

Inventor： 王凯 , 魏玉琼 , 栾天祥 , 刘迪 , 王迪

IPC: H04N21/442 , H04N21/44 , G10L25/63 , G06V40/16 , H04N21/45 , H04N21/81

Abstract: 本申请公开了一种多媒体项目的播放方法和装置、存储介质及电子装置，涉及智慧家庭技术领域，该多媒体项目的播放方法包括：检测目标用户在目标多媒体项目播放到目标播放节点时的目标情绪特征，其中，目标用户是体验目标多媒体项目的用户，目标情绪特征用于指示目标用户的情绪状态；根据目标情绪特征和目标播放节点获取目标多媒体资源；在目标多媒体项目中的目标播放节点播放目标多媒体资源，其中，目标多媒体项目包括在一个或者多个播放节点上播放的多媒体资源，一个或者多个播放节点包括目标播放节点，采用上述技术方案，解决了相关技术中，多媒体项目的播放的过程中，多媒体项目的沉浸度较低等问题。

5.

发明公开
设备的语音控制方法和装置、存储介质及电子装置审中-实审

公开(公告)号：CN116504225A

公开(公告)日：2023-07-28

申请号：CN202310343077.8

申请日：2023-03-31

Applicant: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 海尔智家股份有限公司

Inventor： 魏玉琼 , 栾天祥 , 王凯 , 贾基东

IPC: G10L15/02 , G10L15/06 , G10L15/16 , G10L15/22 , G10L15/30

Abstract: 本申请公开了一种设备的语音控制方法和装置、存储介质及电子装置，涉及智能家居/智慧家庭技术领域，其中，上述方法包括：提取第一语音信号的声学特征，得到第一声学特征，其中，第一语音信号是语音设备在进行语音交互的过程中所采集的语音信号；根据第一声学特征进行语义解析，得到与第一语音信号对应的目标语义意图；在目标语义意图属于一组预设意图的情况下，根据第一声学特征进行语音情感识别，得到与第一语音信号对应的第一情感类别；将第一情感类别与目标语义意图进行融合，得到更新后的目标语义意图，其中，更新后的目标语义意图是带有情感参数的语义意图；控制被控设备执行与更新后的目标语义意图对应的设备操作。

6.

发明公开
目标烹饪视频的生成方法、装置、存储介质及电子装置有权

公开(公告)号：CN115988152A

公开(公告)日：2023-04-18

申请号：CN202211521223.3

申请日：2022-11-30

Applicant: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 海尔智家股份有限公司

Inventor： 王凯 , 魏玉琼 , 栾天祥 , 王迪

IPC: H04N5/265 , H04N21/44 , G10L15/26 , G06F40/20

Abstract: 本申请公开了一种目标烹饪视频的生成方法、装置、存储介质及电子装置，涉及智慧家庭技术领域，该目标烹饪视频的生成方法包括：对目标对象的烹饪过程进行采集，得到所述目标对象的初始烹饪视频，其中，所述初始烹饪视频中包括所述目标对象的烹饪动作，所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备；获取所述烹饪过程中所述烹饪设备工作时产生的音频信号；基于所述烹饪动作，所述烹饪食材，所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本；根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频，采用上述技术方案，解决了如何生成具有解说音频的烹饪视频的技术问题。

7.

发明授权
目标烹饪视频的生成方法、装置、存储介质及电子装置有权

公开(公告)号：CN115988152B

公开(公告)日：2024-09-24

申请号：CN202211521223.3

申请日：2022-11-30

Applicant: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 海尔智家股份有限公司

Inventor： 王凯 , 魏玉琼 , 栾天祥 , 王迪

IPC: H04N5/265 , H04N21/44 , G10L15/26 , G06F40/20

Abstract: 本申请公开了一种目标烹饪视频的生成方法、装置、存储介质及电子装置，涉及智慧家庭技术领域，该目标烹饪视频的生成方法包括：对目标对象的烹饪过程进行采集，得到所述目标对象的初始烹饪视频，其中，所述初始烹饪视频中包括所述目标对象的烹饪动作，所述目标对象使用的烹饪食材和所述目标对象使用的烹饪设备；获取所述烹饪过程中所述烹饪设备工作时产生的音频信号；基于所述烹饪动作，所述烹饪食材，所述烹饪设备的设备数据和所述音频信号生成所述烹饪过程的描述文本；根据所述描述文本对应的烹饪解说音频和所述初始烹饪视频生成目标烹饪视频，采用上述技术方案，解决了如何生成具有解说音频的烹饪视频的技术问题。

8.

发明公开
一种在线多输入多输出语音信号的去混响方法及系统审中-公开

公开(公告)号：CN118057528A

公开(公告)日：2024-05-21

申请号：CN202211448747.4

申请日：2022-11-18

Applicant: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 海尔智家股份有限公司

Inventor： 栾天祥

IPC: G10L21/0208 , G10L21/0216 , G10L25/30 , G10L21/0232

Abstract: 本发明提供一种在线多输入多输出语音信号的去混响方法及系统，该方法包括：对麦克风阵列接收信号进行频域转换，获取多通道语音频域信号；基于多通道语音频域信号的滤波器系数阶数，获取滤波器系数矩阵，根据更新步长，对滤波器系数矩阵进行更新，获取更新后的滤波器系数矩阵；根据更新后的滤波器系数矩阵，对多通道语音频域信号进行去混响处理，获取去混响后的多通道语音频域信号；根据去混响后的多通道语音频域信号和补偿系数，确定多通道语音频域信号去混响结果，其中，补偿系数是通过补偿模型输出得到，补偿模型是由样本误差去混响信号和样本无混响信号，对神经网络进行训练得到。本发明可实时在线去混响，降低运算复杂度，实现计算量可控。

9.

发明公开
语音聚类方法、装置、存储介质及电子装置审中-实审

公开(公告)号：CN116013315A

公开(公告)日：2023-04-25

申请号：CN202211511494.0

申请日：2022-11-29

Applicant: 海尔优家智能科技(北京)有限公司 , 青岛海尔科技有限公司 , 海尔智家股份有限公司

Inventor： 栾天祥

IPC: G10L17/02 , G10L17/18

Abstract: 本申请公开了一种语音聚类方法、装置、存储介质及电子装置，涉及智慧家庭技术领域，该语音聚类方法包括：确定获取的目标语音的语音特征的编码序列；确定编码序列的标签向量，其中，标签向量用于表示目标语音的连续性；将标签向量和编码序列输入第一神经网络模型，得到第一神经网络模型输出的高维特征向量，其中，高维特征向量用于表示发出目标语音的对象所属的类别，第一神经网络模型中包括多层网络编码器；将高维特征向量和高维特征向量的标签输入第二神经网络模型，得到第二神经网络模型输出的目标概率值，其中，目标概率值用于表示目标语音与其他语音属于同一类别的概率，第二神经网络模型中包括多层网络编码器，其他语音是已进行语音类别聚类的语音。

10.

发明公开
智能设备的交互方法和装置、存储介质及电子装置审中-实审

公开(公告)号：CN116418611A

公开(公告)日：2023-07-11

申请号：CN202111662830.7

申请日：2021-12-30

Applicant: 海尔优家智能科技(北京)有限公司 , 海尔智家股份有限公司

Inventor： 王凯 , 栾天祥 , 王迪 , 赵培

IPC: H04L12/28

Abstract: 本申请公开了一种智能设备的交互方法和装置、存储介质及电子装置，其中，上述方法包括：获取使用对象所发出的目标交互数据，其中，目标交互数据为第一模态的交互数据，目标交互数据用于触发第一设备执行第一交互操作；在根据目标交互数据未获取到与第一交互操作对应的交互参数的情况下，获取与目标交互数据对应的目标参考数据，其中，目标参考数据为第二模态的参考数据，目标参考数据用于辅助确定与第一交互操作对应的交互参数；对目标交互数据和目标参考数据执行融合操作，得到与第一交互操作对应的第一交互参数；按照第一交互参数控制第一设备执行第一交互操作。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification