-
公开(公告)号:CN113177429A
公开(公告)日:2021-07-27
申请号:CN202110074653.4
申请日:2021-01-20
Applicant: 福特全球技术公司
Inventor: 普纳杰·查克拉瓦蒂 , 阿什利·伊丽莎白·米克斯
Abstract: 本公开提供了“车辆神经网络训练”。一种计算机,包括:处理器和存储器,所述存储器包括由所述处理器执行以进行以下操作的指令:确定第一视频图像中的第一对象的六自由度(DoF)数据;以及基于所述六DoF数据生成与所述第一视频图像相对应的合成视频图像,所述合成视频图包括合成对象和合成对象标签。所述指令可以包括用于进行以下操作的另外的指令:基于配对的第一视频图像和合成视频图像来训练生成式对抗网络(GAN)以生成修改的合成图像,并且训练深度神经网络以基于合成对象在修改的合成视频图像中定位合成对象。所述指令可以包括用于进行以下操作的另外的指令:将训练过的深度神经网络下载到车辆中的计算装置。
-
公开(公告)号:CN110335584A
公开(公告)日:2019-10-15
申请号:CN201910237141.8
申请日:2019-03-27
Applicant: 福特全球技术公司
Inventor: 普拉韦恩·纳拉亚南 , 丽莎·斯卡里亚 , 弗朗索瓦·沙雷特 , 阿什利·伊丽莎白·米克斯 , 瑞恩·伯克
Abstract: 本公开提供了“神经网络生成建模以变换语音发音和增强训练数据”。公开了用于使用深度生成模型进行语音变换和生成合成语音的系统、方法和装置。本公开的方法包括从多个说话人接收包括语音发音的多个迭代的输入音频数据。所述方法包括基于所述输入音频数据而生成输入谱图并将所述输入谱图传输到被配置为生成输出谱图的神经网络。所述方法包括从所述神经网络接收所述输出谱图并基于所述输出谱图而生成包括所述语音发音的合成音频数据。
-