歌名相似度的确定方法、设备和存储介质

    公开(公告)号:CN116956060A

    公开(公告)日:2023-10-27

    申请号:CN202310804396.4

    申请日:2023-06-30

    IPC分类号: G06F18/22 G06F18/23

    摘要: 本公开提供了一种歌名相似度的确定方法、设备和存储介质,属于文本处理技术领域。在本公开实施例中,在长度较长的歌名中确定是否存在与长度较短的歌名相同的字段,如果存在,则根据该字段的首端与长歌名的首端之间的距离计算两个歌名之间相似度。当存在两个较短且不同的歌名需要计算相似度时,计算得到的相似度很低,可以提高计算出的相似度的准确性。

    一种音频曲目识别方法、设备及可读存储介质

    公开(公告)号:CN113468369A

    公开(公告)日:2021-10-01

    申请号:CN202110838560.4

    申请日:2021-07-23

    发明人: 陈颖

    IPC分类号: G06F16/683 G06F16/68

    摘要: 本申请公开了一种音频曲目识别方法、设备及可读存储介质,该方法包括:获取待识别的目标音频,并在对目标音频分片后,提取各个分片的音频指纹特征;获取各个音频指纹特征分别匹配的歌曲ID,及各个歌曲ID的播放量排名;对歌曲ID进行统计,得到各个歌曲ID的命中片数;利用播放量排名和命中片数,得到各个歌曲ID的命中排名比;利用命中排名比,从各个歌曲ID对应曲目中筛选出目标音频的组成曲目。在本申请中,不仅可参照当前目标音频中各个歌曲ID的命中情况,还可结合歌曲ID的实际播放量情况,能够使得最终识别得到的组成曲目更加的精准,且倾向于正版曲目。即,在有效识别目标音频的组成曲目的同时,还可打击盗版,弘扬正版。

    一种音乐片段的字幕显示方法、设备及可读存储介质

    公开(公告)号:CN114666653B

    公开(公告)日:2024-07-19

    申请号:CN202210290074.8

    申请日:2022-03-23

    发明人: 陈颖

    摘要: 本申请公开了一种音乐片段的字幕显示方法、设备及计算机可读存储介质,将待识别音频切分为多个音频切片,并提取每个音频切片的音频指纹特征;从基于不同歌曲建立的音频指纹库中匹配音频指纹特征,以得到待识别音频中歌曲播放片段的播放位置及歌曲播放片段对应的歌曲信息;定位歌曲播放片段中只有歌曲播放的纯音乐片段的播放位置,以在纯音乐片段播放时显示相应的歌曲信息。可见,本申请可从待识别音频中定位纯音乐片段的播放位置,并在纯音乐片段播放时显示相应的歌曲信息,可避免纯音乐片段因智能字幕翻译导致的字幕错误,从而提升了字幕准确度,给用户带来更好的体验。

    听歌识曲的多版本结果确定方法和设备

    公开(公告)号:CN116383434A

    公开(公告)日:2023-07-04

    申请号:CN202310329159.7

    申请日:2023-03-24

    摘要: 本申请涉及听歌识曲技术领域,提供一种听歌识曲的多版本结果确定方法、和设备,可以避免单结果返回导致仅返回盗歌的情况。本申请中,获取用户请求识别的音频片段;基于音频片段的指纹与听歌识曲音频指纹库里的指纹之间的相似度,在听歌识曲音频库里确定被召回歌曲;基于被召回歌曲在预先构建的同歌组库里进行检索,扩充得到多结果歌曲池;同歌组库里的同歌组是基于同一首歌的不同版本形成的;将多结果歌曲池里的各歌曲归至相应的版本类别,在每个版本类别中选取热度值满足预设热度条件的歌曲,得到多版本结果,以将多版本结果返回给用户。

    一种音频曲目识别方法、设备及可读存储介质

    公开(公告)号:CN113486209A

    公开(公告)日:2021-10-08

    申请号:CN202110836995.5

    申请日:2021-07-23

    发明人: 陈颖

    IPC分类号: G06F16/683 G06F16/65

    摘要: 本申请公开了一种音频曲目识别方法、设备及可读存储介质,该方法包括:获取待识别的目标音频,并在对目标音频分片后,提取各个分片的音频指纹特征;获取各个音频指纹特征分别匹配的歌曲ID;对歌曲ID进行同歌聚类,得到聚类结果;利用聚类结果,确定出各个歌曲ID的置信度;利用置信度,从各个歌曲ID对应曲目中筛选出目标音频的目标曲目。本申请能够在未标注目标音频所包含曲目的情况下,识别出目标音频的目标曲目。为进一步向用户展示曲目,给音频打标签等提供曲目信息。

    一种数据处理方法以及设备
    6.
    发明公开

    公开(公告)号:CN112927714A

    公开(公告)日:2021-06-08

    申请号:CN202110098039.1

    申请日:2021-01-25

    发明人: 陈颖

    IPC分类号: G10L25/12 G10L25/24 G10L25/63

    摘要: 本申请实施例公开一种数据处理方法以及设备,其中方法包括如下步骤:从训练语音集合中获取第一语音样本,从目标语音集合中获取第二语音样本;采用主成分分析法获取第一语音样本对应的第一低维特征和第二语音样本对应的第二低维特征;将第二低维特征映射至第一低维特征对应的第一低维空间,生成第二低维特征在第一低维空间的第二映射特征;根据第二映射特征和第二低维特征生成第一低维特征在第二低维空间对应的第一映射特征;根据第一映射特征生成情感识别模型,情感识别模型用于预测与第二语音样本的语言类型相同的待识别语音的情感类型。采用本申请,可以节省资源和开发成本,提高语音情感分类的准确率。

    一种音频匹配方法、装置和设备
    8.
    发明公开

    公开(公告)号:CN112256911A

    公开(公告)日:2021-01-22

    申请号:CN202011133937.8

    申请日:2020-10-21

    发明人: 陈颖

    IPC分类号: G06F16/68

    摘要: 本申请公开了一种音频匹配方法、装置和设备,在该方案中,首先提取第一歌曲中的目标位置对应的第一音频指纹;然后按照目标位置,提取第二歌曲中的相应位置对应的第二音频指纹;进而确定第一音频指纹和第二音频指纹的一致性占比和相似性占比,若一致性占比大于第一阈值且相似性占比大于第二阈值,则确定第一歌曲和第二歌曲为同一首歌。在该方案中,以两首歌曲中的音频指纹为匹配对象,利用一致性占比和相似性占比此双重判断条件匹配两个音频指纹,能够提高歌曲匹配的准确性和精度。相应地,本申请提供的音频匹配装置和设备,也同样具有上述技术效果。

    音频处理方法、装置及存储介质

    公开(公告)号:CN109817241A

    公开(公告)日:2019-05-28

    申请号:CN201910120377.3

    申请日:2019-02-18

    发明人: 陈颖 李胜存

    摘要: 本发明公开了一种音频处理方法、装置及存储介质,方法包括:将能量值中大于能量阈值的能量值所对应的音频片段确定为待检测音频片段;将待检测音频片段中片段时长小于预设时长的音频片段确定为待处理音频片段;根据与待处理音频片段相邻的N帧信号的幅值以及待处理音频片段的幅值确定衰减系数;根据衰减系数对待处理音频片段进行去噪处理,得到处理后的音频信号。本发明实施例将音频信号中能量值大于预设能量值的音频片段确定为待检测音频片段,然后将片段时长小于预设时长的待检测音频片段确定为待处理音频片段,最后对该待处理音频片段进行去噪处理,本方案可以准确获取瞬时噪声对应的音频片段,进而有效去除音频信号中的瞬时噪声。

    检索音频的方法、设备和存储介质

    公开(公告)号:CN117390215A

    公开(公告)日:2024-01-12

    申请号:CN202311253261.X

    申请日:2023-09-26

    摘要: 本公开提供了一种检索音频的方法、设备和存储介质,属于音频识别技术领域。采用本公开,在检索音频过程中,检索到的音频集合中如果包括非优质版本的歌曲音频,服务器会将其调整为由优质版本音频组成的音频集合,再基于调整后的音频集合确定检索结果,发送给用户的终端。用户对检索结果中的各个歌曲音频进行试听时,不会因为对非优质版本的歌曲音频的试听而浪费用户的时间,从而提高检索效率。