专利检索 ap:("腾讯音乐娱乐科技(深圳)有限公司") AND inv:"宗旋" 第 1 页

1.

发明公开
一种卡路里消耗检测方法、设备及存储介质审中-实审

公开(公告)号：CN116168721A

公开(公告)日：2023-05-26

申请号：CN202310184670.2

申请日：2023-02-21

申请人： 腾讯音乐娱乐科技(深圳)有限公司

发明人： 江益靓 , 宗旋 , 孔令城 , 姜涛 , 聂东白 , 陈永安 , 孙琦

IPC分类号： G10L25/48 , G10L25/03 , G10L25/27

摘要： 本申请公开了一种卡路里消耗检测方法、设备及存储介质，包括：获取包含目标主体歌唱声音的待检测音频，并对所述待检测音频进行声音特征提取，得到基频序列和响度序列；根据所述基频序列计算音高特征值和有效基频长度，并根据所述响度序列计算响度特征值；利用所述音高特征值、所述有效基频长度及所述响度特征值确定出与所述待检测音频对应的目标主体在歌唱时消耗的卡路里数。本申请能够准确估算出用户在歌唱中的卡路里消耗，增强卡路里计算趣味性，提升用户体验。

2.

发明公开
处理人声音频的方法、设备和存储介质审中-公开

公开(公告)号：CN116939431A

公开(公告)日：2023-10-24

申请号：CN202310872076.2

申请日：2023-07-14

申请人： 腾讯音乐娱乐科技(深圳)有限公司

发明人： 张超鹏 , 翁志强 , 宗旋 , 赵伟峰

IPC分类号： H04R3/00

摘要： 本公开实施例公开了一种处理人声音频的方法、设备和存储介质，属于音频技术领域。音频的亮度是影响音频清晰度的主要原因之一。亮度一般是与音频的中高频谐波的能量的占比挂钩。对于较低音域的音频，说明该音频的能量主要分布在低频段处，亮度较低。本公开实施例中，将这种音频输入到激励器中，通过激励器增强该音频的中高频的谐波的幅度(也即增强该音频中高频谐波的能量)，也即可以提高音频的亮度，进一步可以提高人声音频的清晰度。

3.

发明公开
一种基于歌曲的音效处理方法及相关装置审中-实审

公开(公告)号：CN116884374A

公开(公告)日：2023-10-13

申请号：CN202310933205.4

申请日：2023-07-27

申请人： 腾讯音乐娱乐科技(深圳)有限公司

发明人： 张超鹏 , 吴逸龙 , 宗旋

IPC分类号： G10H1/36 , G10H1/02 , H04L65/75 , H04L65/40

摘要： 本发明实施例提供了一种基于歌曲的音效处理方法及相关装置，用于生成线上K歌的演唱会音效。本发明实施例方法包括：所述服务器通过所述主唱侧终端获取主唱演唱目标歌曲的原唱干声及所述目标歌曲的伴奏音乐；所述服务器通过所述观众侧终端获取观众在第一预设时段为所述目标歌曲所添加的配器参数，所述配器参数包括口哨声、欢呼声、鼓掌声和节奏型拍声中的至少一项；所述服务器基于所述配器参数生成配器信号；所述服务器将所述主唱的原唱干声、所述伴奏音乐和所述配器信号进行混音处理，以在线上K歌中生成所述目标歌曲的演唱会音效。

4.

发明公开
混音处理方法、计算机设备和计算机程序产品审中-实审

公开(公告)号：CN115171633A

公开(公告)日：2022-10-11

申请号：CN202210733322.1

申请日：2022-06-27

申请人： 腾讯音乐娱乐科技(深圳)有限公司

发明人： 寇志娟 , 翁志强 , 宗旋 , 李革委 , 胡鹏

IPC分类号： G10H1/36 , G10H1/00

摘要： 本申请涉及音频技术领域，提供了一种混音处理方法、计算机设备和计算机程序产品，能够显著提升混音效率。所述方法包括：获取请求端发布的混音任务，从预设的多个音效参数模板中获取与所述混音任务关联的目标音效参数模板；每个音效参数模板中存储有对应混音效果的混音参数；基于所述目标音效参数模板获取所述混音任务的混音操作信息；基于所述混音操作信息对所述混音任务关联的干声音频和所述干声音频的伴奏音频进行混音处理，得到混音音频；向所述请求端返回所述混音音频。

5.

发明公开
音频数据的处理方法、服务器及计算机可读存储介质审中-实审

公开(公告)号：CN116631425A

公开(公告)日：2023-08-22

申请号：CN202310589026.3

申请日：2023-05-23

申请人： 腾讯音乐娱乐科技(深圳)有限公司

发明人： 张超鹏 , 邓源强 , 陈凯 , 宗旋

IPC分类号： G10L21/0208 , G10L21/0216 , G10L25/30

摘要： 本申请涉及一种音频数据的处理方法、电子设备和计算机可读存储介质。所述方法包括：获取用户演唱目标歌曲时的录制音频数据；录制音频数据包括录制到的目标歌曲的伴声音频数据在经过回采系统后得到的回采数据和用户的干声数据；提取伴声音频数据的音频特征，并将音频特征输入回采预测模型，由回采预测模型预测伴声音频数据在经过回采系统后得到的预测音频特征；基于预测音频特征，确定针对伴声音频数据的预测回采数据；基于预测回采数据对录制音频数据进行回踩消除处理，得到录制音频数据中关于用户的预测干声数据。采用本方法能够减少音频消除过程中消音不准确和消音不充分的问题，以及提高音频消音处理的有效性和准确性。

6.

发明公开
歌声生成方法、计算机设备和存储介质审中-实审

公开(公告)号：CN116486765A

公开(公告)日：2023-07-25

申请号：CN202310479257.9

申请日：2023-04-26

申请人： 腾讯音乐娱乐科技(深圳)有限公司

发明人： 陈梦 , 张超鹏 , 宗旋

IPC分类号： G10H1/00

摘要： 本申请涉及一种歌声生成方法、计算机设备和存储介质。所述方法包括：获取目标曲谱的音节信息、音符信息和连音符信息；根据音节信息、音符信息和连音符信息，确定目标曲谱的曲谱音素编码特征、曲谱音素时长和音素级别基频；根据曲谱音素编码特征、曲谱音素时长和音素级别基频，生成目标曲谱的曲谱音频；获取曲谱音频对应的帧级别基频和目标曲谱对应的曲谱音素信息，根据帧级别基频和曲谱音素信息，生成目标歌声音频。采用本方法能够通过解析曲谱确定曲谱信息，根据曲谱信息确定曲谱特征，根据曲谱特征生成目标曲谱的曲谱音频，基于曲谱音频和目标曲谱的音素信息，生成以预设音色演唱目标曲谱的歌声，提高合成歌声的自然度。

7.

发明公开
动作视频的生成方法、扩散模型的训练方法和设备审中-实审

公开(公告)号：CN118245820A

公开(公告)日：2024-06-25

申请号：CN202410434882.6

申请日：2024-04-11

申请人： 腾讯音乐娱乐科技(深圳)有限公司

发明人： 庄晓滨 , 宗旋

IPC分类号： G06F18/22 , G06F18/214 , G06V20/40 , G06V10/30 , G06V10/75 , G06V10/82

摘要： 本公开提供了一种动作视频的生成方法、扩散模型的训练方法和设备，属于计算机技术领域。所述方法包括：获取目标音频对应的图像噪声数据和目标音频相关数据，目标音频相关数据包括目标音频或目标音频的音频特征数据；将目标音频相关数据和图像噪声数据输入训练完成的扩散模型，以使扩散模型基于目标音频相关数据对图像噪声数据进行图像去噪还原处理，得到目标音频对应的预测动作数据；基于目标音频和预测动作数据，生成目标音频对应的动作视频。采用本公开，提高了预测动作数据与目标音频的匹配度，提高了生成的动作视频的完整性。

8.

发明公开
音频处理方法、计算机设备及计算机存储介质审中-实审

公开(公告)号：CN117373480A

公开(公告)日：2024-01-09

申请号：CN202311327623.5

申请日：2023-10-13

申请人： 腾讯音乐娱乐科技(深圳)有限公司

发明人： 王磊 , 黄斯亮 , 王玉奎 , 龙少杭 , 冯伟赞 , 刘伶俐 , 施翠婷 , 梁兴威 , 欧阳金凯 , 刘腾飞 , 张田博 , 李贤茂 , 宗旋

IPC分类号： G10L25/18 , G10L25/27 , G10L25/48

摘要： 本申请实施例公开了一种音频处理方法、计算机设备及计算机存储介质。本申请实施例包括：服务端根据与演唱端的网络传输状况信息确定演唱端的候选干声音频的网络传输性能标签，使用目标音频听感评价模型获得候选干声音频的听感标签，使用目标音频音质评价模型获得候选干声音频的音质标签，从多路候选干声音频中确定网络传输性能标签、听感标签以及音质标签满足预设要求的多路目标干声音频，并将多路目标干声音频进行混合，得到合唱音频。基于各项评价指标对多路干声音频的质量进行衡量，从而筛选出优质的干声音频，进而由多路优质的干声音频合成的合唱音频的听感效果更佳，提升用户合唱的兴趣和体验。

9.

发明公开
歌声合成方法及相关装置审中-公开

公开(公告)号：CN116072143A

公开(公告)日：2023-05-05

申请号：CN202310126243.9

申请日：2023-02-07

申请人： 腾讯音乐娱乐科技(深圳)有限公司

发明人： 庄晓滨 , 陈梦 , 宗旋

IPC分类号： G10L25/24 , G10L13/02 , G10L13/08 , G10L13/06 , G10L19/16 , G10L15/06

摘要： 本申请实施例提供了一种歌声合成方法及相关装置，其中方法包括：将待合成音频的音节序列和基频标记序列输入到目标声学模型中的共振峰模型中，获得待合成音频的共振峰表征信息，共振峰表征信息为无音色信息的表征信息；将待合成音频的共振峰表征信息以及音高信息输入到目标声学模型中的音色转换模型中，获得梅尔谱特征，合成的梅尔谱特征包括目标对象的音色信息，音色转换模型是基于目标对象的样本音频训练获得的；将梅尔谱特征输入到声码器中，获得合成的音频信号。可见，采用本申请实施例，可对任意音色跨语种的歌声进行合成。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类