-
公开(公告)号:CN111787986B
公开(公告)日:2024-08-13
申请号:CN201980016107.6
申请日:2019-02-26
申请人: 苹果公司
IPC分类号: A63F13/213 , A63F13/60 , A63F13/215 , A63F13/424
摘要: 本公开的实施方案可提供用于至少部分地基于从硬件部件提取的面部特征和/或语音特征特性来调整视频剪辑的音频和/或视频信息的技术。例如,响应于检测到生成虚拟头像的头像视频剪辑的请求,可捕获与相机的视场中的面部相关联的视频信号,以及音频信号。语音特征特性和面部特征特性可分别从所述音频信号和所述视频信号中提取。在一些示例中,响应于检测到预览所述头像视频剪辑的请求,可至少部分地基于所述面部特征特性和所述语音特征特性来生成经调整的音频信号,并且可使用所述经调整的音频信号显示所述虚拟头像的所述视频剪辑的预览。
-
公开(公告)号:CN115440253A
公开(公告)日:2022-12-06
申请号:CN202210623746.2
申请日:2022-06-02
申请人: 苹果公司
摘要: 本公开涉及用于电子设备的声音检测。提供了用于提供本地训练模型以使用电子设备检测各个声音的系统和方法。通过利用电子设备获得用于检测模型的训练样本,并且基于所获得的训练样本生成附加的负训练样本和正训练样本,可以在该电子设备处用该检测模型对各个声音进行本地检测。可以提供两阶段检测过程,其中设备处的触发模型将音频输入与参考声音进行比较以触发该设备处的检测模型。在电子设备处用检测模型检测各个声音还可以利用声音场景中的多个设备的音频捕获能力来捕获多个并发训练样本。
-
公开(公告)号:CN112512649B
公开(公告)日:2024-05-24
申请号:CN201980046539.1
申请日:2019-02-26
申请人: 苹果公司
IPC分类号: A63F13/213 , A63F13/60 , A63F13/215 , A63F13/424
摘要: 本公开的实施方案可提供用于至少部分地基于用户的面部特征和/或语音特征特性来提供音频和/或视频效果的系统、方法和计算机可读介质。例如,可由设备记录该用户的视频和/或音频信号。可分别从该语音音频信号和该视频中提取语音音频特征和面部特征特性。该用户的该面部特征可用于修改虚拟形象的特征以模拟该用户的该面部特征特性。该提取的语音音频特征可被修改以生成经调整的音频信号,或者音频信号可由该语音音频特征合成。该经调整/合成的音频信号可模拟该虚拟形象的语音。可在该用户的设备处提供经修改的视频/音频的预览。
-
公开(公告)号:CN117501236A
公开(公告)日:2024-02-02
申请号:CN202280043272.2
申请日:2022-05-19
申请人: 苹果公司
发明人: M·R·勒纳 , C·M·阿文达诺 , E·C·克兰菲尔 , I·M·菲什 , C·B·弗莱扎克 , C·C·霍伊特 , C·S·李 , J·马祖尔 , S·E·帕纳吉 , C·J·罗姆尼 , J·D·坦纳 , Y·吴 , M·T·祖格
IPC分类号: G06F3/16
摘要: 本公开整体涉及提供听觉特征。一种示例性方法包括:在与一个或多个输入设备通信的计算机系统处:在播放第一类型的音频媒体项时,经由该一个或多个输入设备接收播放第二类型的音频媒体项的请求;根据确定满足并行音频标准集,并行地播放:该第一类型的该音频媒体项;以及该第二类型的该音频媒体项;以及根据确定不满足该并行音频标准集:停止播放该第一类型的该音频媒体项;以及播放该第二类型的该音频媒体项。
-
公开(公告)号:CN111787986A
公开(公告)日:2020-10-16
申请号:CN201980016107.6
申请日:2019-02-26
申请人: 苹果公司
IPC分类号: A63F13/213 , A63F13/60 , A63F13/215 , A63F13/424
摘要: 本公开的实施方案可提供用于至少部分地基于从硬件部件提取的面部特征和/或语音特征特性来调整视频剪辑的音频和/或视频信息的技术。例如,响应于检测到生成虚拟头像的头像视频剪辑的请求,可捕获与相机的视场中的面部相关联的视频信号,以及音频信号。语音特征特性和面部特征特性可分别从所述音频信号和所述视频信号中提取。在一些示例中,响应于检测到预览所述头像视频剪辑的请求,可至少部分地基于所述面部特征特性和所述语音特征特性来生成经调整的音频信号,并且可使用所述经调整的音频信号显示所述虚拟头像的所述视频剪辑的预览。
-
公开(公告)号:CN112512649A
公开(公告)日:2021-03-16
申请号:CN201980046539.1
申请日:2019-02-26
申请人: 苹果公司
IPC分类号: A63F13/213 , A63F13/60 , A63F13/215 , A63F13/424
摘要: 本公开的实施方案可提供用于至少部分地基于用户的面部特征和/或语音特征特性来提供音频和/或视频效果的系统、方法和计算机可读介质。例如,可由设备记录该用户的视频和/或音频信号。可分别从该语音音频信号和该视频中提取语音音频特征和面部特征特性。该用户的该面部特征可用于修改虚拟形象的特征以模拟该用户的该面部特征特性。该提取的语音音频特征可被修改以生成经调整的音频信号,或者音频信号可由该语音音频特征合成。该经调整/合成的音频信号可模拟该虚拟形象的语音。可在该用户的设备处提供经修改的视频/音频的预览。
-
-
-
-
-