-
公开(公告)号:CN118968971A
公开(公告)日:2024-11-15
申请号:CN202411201553.3
申请日:2024-08-29
申请人: 腾讯音乐娱乐科技(深圳)有限公司
IPC分类号: G10L15/06 , G10L15/02 , G06F16/9535 , G06F16/68
摘要: 本申请公开了一种音频推荐模型训练方法、音频推荐方法及设备和介质,该方法包括:获取训练音频集;利用待训练的音频推荐模型从多个维度提取训练音频的多个单维特征,将多个单维特征拼接为多维特征,并将多维特征映射为多维映射特征;利用待训练的音频推荐模型对多个单维特征进行扩充,以使扩充后的单维特征的尺寸与多维特征的尺寸相同,并分别将多个扩充后的单维特征映射为多个单维映射特征;基于多维映射特征确定多维损失值,基于多个单维映射特征确定多个单维损失值,并基于多维损失值、多个单维损失值计算整体损失值;基于整体损失值更新待训练的音频推荐模型,获得训练完成的音频推荐模型。本申请提高了音频推荐模型推荐音频的准确度。
-
公开(公告)号:CN118898013A
公开(公告)日:2024-11-05
申请号:CN202410978084.X
申请日:2024-07-22
申请人: 华南师范大学
发明人: 朱定局
IPC分类号: G06F18/24 , G06F16/68 , G06F16/638 , G06F16/78 , G06N3/08
摘要: 不良言论音视频多模态深度学习方法和人工智能治理系统,利用深度学习模型识别音视频中的不良言论,根据,递进式地识别,既能利用文本、音频、视频智能检测模型在速度上的差异,来尽快地检测到容易检测的不良言论,又能综合音视频中多模态信息递进地调用音频、视频智能检测模型,来提高识别准确率,降低漏检率;同时,自动地修正音视频中的不良言论供用户参考,并且将用户修正后的音视频用于增量训练和测试智能修正模型,从而能够不断提高智能修正模型的准确率。
-
公开(公告)号:CN114661941B
公开(公告)日:2024-10-29
申请号:CN202210299794.0
申请日:2022-03-24
申请人: 广州荔支网络技术有限公司
IPC分类号: G06F16/68 , G06F16/635 , G06N3/0464 , G06N3/044 , G06N5/01 , G06N3/08
摘要: 本发明涉及一种点击率预测模型构建方法、装置、计算机设备和存储介质。所述方法包括基于用户播放声音的行为数据、被播放声音的文本数据,生成播放会话数据;根据播放会话数据的声音唯一标识的向量表示,声音唯一标识对应的第一权重,播放会话数据的主播唯一标识的向量表示,主播唯一标识对应的第二权重,确定用户的向量表示;将用户基础属性数据、用户的统计类信息、标签的统计类信息、用户的向量表示、标签的向量表示作为训练数据输入初始预测模型,并根据损失函数对初始预测模型进行优化,得到点击率预测模型。所述点击率预测模型不需要耗费大量的存储空间。
-
公开(公告)号:CN118551074B
公开(公告)日:2024-10-25
申请号:CN202411025431.3
申请日:2024-07-30
申请人: 浙江大学
IPC分类号: G06F16/68 , G06F18/213 , G06N3/0455
摘要: 本发明公开了一种面向影视配乐的跨模态音乐生成方法和装置,该生成方法仅仅且同时对空间特征适配器和时序控制器进行训练,与现有技术相比,本发明可以仅仅将需要训练的空间特征适配器和时序控制器加载到GPU中,且不需要分别对空间特征适配器和时序控制器进行训练,从而显著减少内存的使用,提高训练速度。通过训练完成的空间特征适配器和最终音乐查询向量从视觉特征向量中筛选出与音乐相关的音乐特征,以及通过训练完成的时序控制器能够预测出与视频的内容较为一致的预测音乐嵌入,从而得到与视频内容较为一致且较为真实的预测音乐。
-
公开(公告)号:CN118626787A
公开(公告)日:2024-09-10
申请号:CN202410706308.1
申请日:2024-06-03
申请人: 北京卫蓝新能源科技股份有限公司 , 北京万龙精益导控技术有限公司
摘要: 本发明实施例提供一种用于识别超声检测信号的方法及系统,属于自动识别领域。所述方法包括:为样品的多种类型中每种类型的超声检测信号对应的有效数据添加标识标签组合,以得到与所述多种类型中每种类型的有效数据对应的标签化数据;根据所述与所述多种类型中每种类型的有效数据对应的标签化数据,建立与所述标签化数据对应的特征数据库;为待测样品的超声检测信号添加全局标签,以得到带有全局标签的待测超声检测信号;以及利用所述特征数据库识别所述带有全局标签的待测超声检测信号,确定所述待测样品的超声检测信号的识别标签。本发明实施例可以准确地自动识别出超声检测信号的结果。
-
公开(公告)号:CN112786015B
公开(公告)日:2024-09-10
申请号:CN201911074526.3
申请日:2019-11-06
申请人: 阿里巴巴集团控股有限公司
发明人: 廉洁
摘要: 本申请公开了一种数据处理方法以及装置,该方法根据目标音频数据和参考音频数据,获得音频特征信息,将该音频特征信息输入音频分析模型,获得所述音频分析模型输出的用于表示所述目标音频数据与所述目标场景信息是否匹配的分析结果;所述音频分析模型用于根据不同音频数据的音频特征信息判断所述不同音频数据是否匹配相同的场景信息。通过使用本方法,可利用预先训练的音频分析模型高效准确地从大规模原始音频数据中筛选出与预定音频应用场景相匹配的音频数据,采用该音频数据训练语音合成模型,可使得预定音频应用场景中的语音合成效果得到保障。
-
公开(公告)号:CN118567601A
公开(公告)日:2024-08-30
申请号:CN202410606885.3
申请日:2024-05-16
申请人: 恩平市西特尔电子科技有限公司
IPC分类号: G06F3/16 , G06F16/68 , G06F16/635
摘要: 本申请涉及通信技术领域,具体公开了一种功放系统音量的调节方法、装置、计算机设备及存储介质。本申请的音量调节曲线结合了音频特性信息、环境信息以及用户信息,能够适应不同音频、不同环境以及不同用户的音量调节,能够根据音量调节曲线进行音量的自动调节,提高了音量调节的灵活性;其次,可以从预设的曲线数据库中进行匹配获得音量调节曲线,在最高匹配度不为1时,会进一步根据当前情况对曲线进行修正,提高了音量调节的灵活性和准确性。
-
公开(公告)号:CN118551074A
公开(公告)日:2024-08-27
申请号:CN202411025431.3
申请日:2024-07-30
申请人: 浙江大学
IPC分类号: G06F16/68 , G06F18/213 , G06N3/0455
摘要: 本发明公开了一种面向影视配乐的跨模态音乐生成方法和装置,该生成方法仅仅且同时对空间特征适配器和时序控制器进行训练,与现有技术相比,本发明可以仅仅将需要训练的空间特征适配器和时序控制器加载到GPU中,且不需要分别对空间特征适配器和时序控制器进行训练,从而显著减少内存的使用,提高训练速度。通过训练完成的空间特征适配器和最终音乐查询向量从视觉特征向量中筛选出与音乐相关的音乐特征,以及通过训练完成的时序控制器能够预测出与视频的内容较为一致的预测音乐嵌入,从而得到与视频内容较为一致且较为真实的预测音乐。
-
公开(公告)号:CN118312123A
公开(公告)日:2024-07-09
申请号:CN202410460479.0
申请日:2024-04-17
申请人: 广州资云科技有限公司
发明人: 王佳乐
IPC分类号: G06F3/16 , G06F16/683 , G06F16/68 , G06F16/65 , G06F18/213 , G06F18/22 , G06F18/214
摘要: 本申请涉及一种歌曲播放进度识别方法、装置、计算机设备和存储介质。应用于终端,所述终端安装有目标客户端和音频播放器,所述方法包括:响应于开启目标客户端中监测歌曲播放进度的操作,获取音频播放器当前播放的歌曲作为待识别歌曲;从目标客户端对应的预设数据库中,获取待识别歌曲的歌曲特征信息和歌曲段落基调信息;根据歌曲特征信息,识别出待识别歌曲的当前播放进度,并确定当前播放进度所处的歌曲段落,作为目标歌曲段落;在目标客户端的界面中,定位展示目标歌曲段落的段落基调,并基于待识别歌曲的实时播放进度动态展示各歌曲段落的段落基调。采用本方法能够识别出歌曲播放进度,为提前预判未来歌曲基调提供了支持。
-
公开(公告)号:CN112182283B
公开(公告)日:2024-07-02
申请号:CN202010995595.4
申请日:2020-09-21
申请人: 咪咕文化科技有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F16/68
摘要: 本发明实施方式涉及通信技术领域,公开了一种歌曲搜索方法,包括:若搜索关键字的长度大于预设长度,则根据所述搜索关键字构造若干个长度不同且长度大于或等于所述预设长度的第一关键字子串;将每一所述第一关键字子串与每一歌曲的歌词进行匹配,根据匹配的结果返回歌曲的搜索结果。本发明实施方式还公开了一种歌曲搜索装置、网络设备及存储介质。本发明实施方式提供的歌曲搜索方法、装置、网络设备及存储介质,可以提高通过输入的歌词内容来搜索歌曲的搜索准确率。
-
-
-
-
-
-
-
-
-