Patent search ap:("中国第一汽车股份有限公司") AND inv:"张毅" Page 1

1.

发明公开
一种语音信号合成方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN117153142A

公开(公告)日：2023-12-01

申请号：CN202311101067.X

申请日：2023-08-29

Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司

Inventor： 梁小明 , 何金鑫 , 张毅 , 孙宇嘉 , 王紫烟 , 付振 , 王明月

IPC: G10L13/02 , G10L13/047

Abstract: 本发明公开了一种语音信号合成方法、装置、电子设备及存储介质。该方法包括：对输入文本进行正则化处理；将输入文本输入至经过训练的多任务模型；通过声学模型，根据音素序列和韵律结构特征的拼接结果预测语音的声音成分；通过声码器基于声音成分合成语音信号。上述技术方案，通过多任务模型基于指令集将输入文本转换为对应的韵律结构特征和音素序列，最后通过声学模型和声码器将音素序列和韵律结构特征合成语音信号，避免了为每个任务单独构建多任务模型，从而降低了多任务模型的复杂度，增强了文本转音素的精度和质量，提高了语音信号合成的处理效率和准确性，有助于在多语言场景中更加准确地预测出语音信号合成中的发音信息。

2.

发明公开
一种语音编辑及优化方法、装置、设备及存储介质审中-实审

公开(公告)号：CN117409762A

公开(公告)日：2024-01-16

申请号：CN202311267145.3

申请日：2023-09-27

Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司

Inventor： 张毅 , 陈博 , 付振 , 王明月 , 何金鑫 , 孙宇嘉 , 梁小明 , 王紫烟

IPC: G10L13/033 , G10L13/08 , G10L19/16

Abstract: 本发明公开了一种语音编辑及优化方法、装置、设备及存储介质，该方法包括：将原始音频对应的掩盖后音频和待合成文本输入至语音编辑模型，得到编辑后音频，编辑后音频为将掩盖后音频和待合成文本进行编辑合成后生成的音频；将编辑后音频和原始音频输入声音转换模型，得到转换后音频，转换后音频为基于原始音频对编辑后音频的音频特征进行转换后的音频，本发明将原始音频对应的掩盖后音频和待合成文本输入语音编辑模型，得到编辑后音频，完成了自定义角色名场景下的配音任务，提升了用户的沉浸感；将编辑后音频和原始音频输入声音转换模型，优化了编辑后音频与原始音频边界的过渡，且保留了声优原始录制状态，提升了声音编辑后语音的表现力。

3.

发明公开
一种语音识别系统、方法及介质审中-实审

公开(公告)号：CN117059071A

公开(公告)日：2023-11-14

申请号：CN202311139611.X

申请日：2023-09-05

Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司

Inventor： 孙宇嘉 , 陈博 , 付振 , 王明月 , 何金鑫 , 梁小明 , 王紫烟 , 张毅

IPC: G10L15/02 , G10L15/26 , G10L25/18 , G10L25/27

Abstract: 本发明公开了一种语音识别系统、方法及介质。其中，所述系统包括用户模块，用于根据待识别语音数据确定声学特征频谱，并根据声学特征频谱，以及，基于语音识别模型确定待识别语音数据的隐私特征，并将隐私特征发送至云端模块；用户模块，用于根据隐私特征以及基于语音识别模型确定第一文本数据以及第一文本数据得分；云端模块，用于根据隐私特征以及基于语音识别模型确定第二文本数据以及第二文本数据得分，将第二文本数据、第二文本数据得分发送至用户模块；用户模块，还用于基于各文本数据以及各文本数据得分确定目标文本数据。通过执行本方案，可以实现在保护用户隐私的同时保证了语音识别的实时性和准确性，可以提升用户体验。

4.

发明公开
一种车辆座舱内乘员的年龄估计方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN119206818A

公开(公告)日：2024-12-27

申请号：CN202411228364.5

申请日：2024-09-03

Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司

Inventor： 付振 , 梁小明 , 王明月 , 袁鲁峰 , 何金鑫 , 孙宇嘉 , 赵兴科 , 张俊 , 张毅

IPC: G06V40/16 , G06V20/59

Abstract: 本发明实施例公开了一种车辆座舱内乘员的年龄估计方法、装置、电子设备及存储介质。包括：获取车辆座舱内乘员的人脸面部图像，并标注对应的年龄标签；依据标注后的人脸面部图像构建不同年龄段的人脸面部图像数据集，并对年龄标签构建对应的散度特征；依据人脸检测算法及人脸关键点检测算法对人脸面部图像进行裁剪确定至少三个尺寸的人脸面部图像框，并依据至少三个尺寸的人脸面部图像框构建年龄估计预测模型；依据人脸面部图像数据集以及年龄标签对年龄估计预测模型进行训练，直至年龄估计预测模型的总损失函数收敛；依据训练得到的目标年龄估计预测模型对车辆座舱内乘员进行年龄估计。采用本方案，提高了车辆座舱内乘员年龄估计的准确性和效率。

5.

发明公开
一种车载语音识别方法、装置、设备和存储介质审中-实审

公开(公告)号：CN116580713A

公开(公告)日：2023-08-11

申请号：CN202310650869.X

申请日：2023-06-02

Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司

Inventor： 孙宇嘉 , 陈博 , 付振 , 王明月 , 何金鑫 , 梁小明 , 王紫烟 , 张毅

IPC: G10L15/26 , G10L15/16 , G10L15/06

Abstract: 本发明实施例公开了一种车载语音识别方法、装置、设备和存储介质，其中，方法包括：获取目标车辆中各音区车载麦克风采集到的多路原始音频信号，并对所述多路原始音频信号进行信号处理得到混合音区特征；将所述混合音区特征输入到预设音区编码识别神经网络，得到各音区编码特征；将所述各音区编码特征输入到预设语音识别网络，得到各音区语音识别文本内容，并基于所述各音区语音识别文本内容确定目标语音识别结果。本发明实施例的技术方案解决了现有技术中无法准确且高效地识别车内混合语音的问题，可以提高对车内混合语音的识别准确性和识别效率和识别效率。

6.

发明公开
车辆的路况图像的处理方法及装置审中-实审

公开(公告)号：CN116245716A

公开(公告)日：2023-06-09

申请号：CN202310497919.5

申请日：2023-05-06

Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司

Inventor： 孙宇嘉 , 陈博 , 高洪伟 , 付振 , 王明月 , 袁鲁峰 , 何金鑫 , 梁小明 , 王紫烟 , 张毅

IPC: G06T3/00 , G06V20/56 , G06V10/80 , G06V10/82 , G06N3/0455 , G06N3/0464 , G06N3/08 , B60W50/14

Abstract: 本发明公开了一种车辆的路况图像的处理方法及装置。其中，该方法包括：获取车辆的初始路况图像及预设风格图像，其中，初始路况图像为由车辆的图像采集设备对车辆所行驶在的道路的路况进行图像采集而得到，预设风格图像用于表征初始路况图像的显示风格；对初始路况图像进行关键特征提取，得到目标图像矩阵，且对预设风格图像进行风格特征提取，得到目标风格矩阵，其中目标图像矩阵为初始图像中关键物体的描述矩阵，目标风格矩阵为预设风格图像中的风格类型矩阵；对初始路况图像、目标图像矩阵以及目标风格矩阵进行融合，得到目标路况图像。本发明解决了相关技术中对车辆的路况图像的处理准确率低的技术问题。

7.

发明公开
车辆座舱外视线估计方法、装置、设备和存储介质审中-实审

公开(公告)号：CN118570859A

公开(公告)日：2024-08-30

申请号：CN202410707012.1

申请日：2024-06-03

Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司

Inventor： 孙宇嘉 , 陈博 , 付振 , 王明月 , 袁鲁峰 , 何金鑫 , 张毅 , 梁小明 , 王紫烟

IPC: G06V40/16 , G06V40/18 , G06V10/774 , G06V20/70 , G06V20/59

Abstract: 本申请实施例提供一种车辆座舱外视线估计方法、装置、设备和存储介质。该方法包括：获取所述第一摄像头采集的驾驶员图像和所述第二摄像头采集的车辆前视图像；确定所述驾驶员图像中的人脸图像以及所述车辆前视图像中的多个目标图像；针对每个目标图像，根据所述人脸图像、所述目标图像、所述车辆前视图像和预设视线估计模型，确定所述目标图像为所述车辆前视图像中驾驶员的注视目标的预测概率；根据各预测概率，确定所述车辆前视图像中驾驶员的注视目标。该方法提高了车辆座舱外驾驶员视线估计的准确率，且降低了驾驶员视线估计成本。

8.

发明公开
一种文本正则化方法、装置、设备以及存储介质审中-实审

公开(公告)号：CN116662484A

公开(公告)日：2023-08-29

申请号：CN202310615901.0

申请日：2023-05-29

Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司

Inventor： 梁小明 , 何金鑫 , 张毅 , 孙宇嘉 , 王紫烟 , 付振 , 王明月

IPC: G06F16/33 , G06F16/35 , G06F18/24 , G06N3/0455 , G06N3/08

Abstract: 本发明公开了一种文本正则化方法、装置、设备以及存储介质，所述方法包括：对待处理文本进行预处理，得到目标文本；在目标文本中存在非标准词且非标准词属于有歧义类型非标准词的情况下，采用神经网络识别模型对非标准词进行识别，得到非标准词所属的目标字符类型；根据目标字符类型从非标准词的候选转换规则中选择目标转换规则，并采用目标转换规则对非标准词进行替换，得到正则化的目标文本。本发明在将目标文本转换成正则化的目标文本的过程中，采用神经网络识别模型对非标准词进行识别，实现了对有歧义类型非标准词的识别，提高了对歧义文本的识别率，进而提高了文本正则化的准确性。

9.

发明公开
一种异常饮水行为检测方法、装置和存储介质审中-实审

公开(公告)号：CN119478901A

公开(公告)日：2025-02-18

申请号：CN202411401853.6

申请日：2024-10-09

Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司

Inventor： 赵兴科 , 袁鲁峰 , 付振 , 张毅 , 刘相超 , 张俊 , 王明月 , 吴红心

IPC: G06V20/59 , G06V40/16 , G06V10/44 , G06V10/764 , G06V10/82 , G06N3/0464

Abstract: 本发明公开了一种异常饮水行为检测方法、装置、电子设备和存储介质，涉及安全驾驶领域，该方法包括：通过关键点检测模型，获取各个视频帧的关键点位；若获取到饮水起始帧，将喉部点位加入关键点位，并获取喉部点位的移动轨迹；若获取到饮水结束帧，将喉部点位移出关键点位，并根据喉部点位的移动轨迹获取饮水行为频率；根据饮水行为频率确定是否存在异常饮水行为。本发明实施例的技术方案，不但实现了异常饮水行为的自动检测，确保了对驾驶安全和人身健康的有效监测，而且降低了关键点位的获取难度，避免了客观环境因素和用户行为习惯对检测结果的影响，提高了异常饮水行为的检测效率。

10.

发明公开
轮胎气压检测方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN119168946A

公开(公告)日：2024-12-20

申请号：CN202411153515.5

申请日：2024-08-21

Applicant: 中国第一汽车股份有限公司 , 一汽(南京)科技开发有限公司

Inventor： 付振 , 赵兴科 , 袁鲁峰 , 孙建蕾 , 何金鑫 , 张毅 , 王明月 , 吴红心 , 刘相超 , 张俊

IPC: G06T7/00 , G06T7/13 , G06T7/62

Abstract: 本发明公开了一种轮胎气压检测方法、装置、设备、介质及程序产品，涉及轮胎检测技术领域。该方法包括：获取目标轮胎的目标轮胎图像；对目标轮胎图像进行检测，获取辐条框架参考线、目标轮胎的胎身检测线，以及辐条框架参考线与目标轮胎的胎身检测线之间的最大距离；将辐条框架参考线向目标轮胎方向径向延伸最大距离，生成目标轮胎的胎身实际线；构建胎身检测线和胎身实际线之间的胎身形变区域，以及辐条框架参考线与胎身实际线之间的胎身原始区域；计算胎身形变区域和胎身原始区域之间的面积占比值，并根据面积占比值，确定目标轮胎的轮胎气压状态。本发明实施例的技术方案可以提高了轮胎气压状态检测的准确度、便捷性、高效性和智能化。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification