音频文件的生成方法、终端设备及介质

    公开(公告)号:CN109326270B

    公开(公告)日:2024-10-18

    申请号:CN201811085971.5

    申请日:2018-09-18

    摘要: 本发明适用于人工智能技术领域,提供了一种音频文件的生成方法、终端设备及介质,该方法包括:获取多个音频训练样本;根据音频训练样本,构建并训练神经网络模型;检测用户输入的用于构建目标音频波形的多个音名,并确定其中每一个音名对应的编码值;通过神经网络模型对确定出的各个编码值进行处理,得到包含依序排列的多个键值对的第一键值对序列;生成基于第一键值对序列的音频文件。本发明通过神经网络模型来实现音频文件的自动生成,使得用户无需再耗费较长的时间周期来进行思考及创作,因而提高了音乐作品的创作效率;由于输出的音频文件能够在一定程度上具备乐理性,故满足了用户实际的音乐创作需求,达到了较好的音乐创作效果。

    基于特定风格的音乐生成方法、装置、设备及存储介质

    公开(公告)号:CN113096621B

    公开(公告)日:2024-05-28

    申请号:CN202110322904.6

    申请日:2021-03-26

    IPC分类号: G10L13/08

    摘要: 本发明涉及人工智能领域,公开了一种基于特定风格的音乐生成方法、装置、设备及存储介质,用于根据特定的风格生成音乐作品,提高了音乐的生成效率和音乐作品的可控性。基于特定风格的音乐生成方法包括:获取原始数据;对原始数据进行标记,生成中间数据,中间数据包含多个事件;将中间数据输入预置的演奏编码器和预置的旋律编码器,基于相对注意力机制和前馈神经网络生成编码数据;将编码数据输入预置的解码器,生成解码数据;基于预置的调节机制对解码数据进行错误修正,得到目标数据,根据目标数据生成最终的音乐作品,调节机制包括旋律调节、演奏调节和输入干扰。此外,本发明还涉及区块链技术,生成的佛乐作品可存储于区块链节点中。

    基于语音合成的空气质量展示方法、装置及终端设备

    公开(公告)号:CN109493839B

    公开(公告)日:2024-01-23

    申请号:CN201811340227.5

    申请日:2018-11-12

    IPC分类号: G10H7/00

    摘要: 本发明适用于数据处理技术领域,提供了基于语音合成的空气质量展示方法、装置、终端设备以及计算机可读存储介质,包括:获取展示地点的地理特征,并将多个特征区间中符合地理特征的特征区间确定为第一目标区间,其中每个特征区间对应一个音阶值;将第一目标区间的所述音阶值与展示地点建立映射关系,并获取展示地点的空气质量指数,基于空气质量指数和预设的节奏模板确定展示节奏序列;将与展示地点存在映射关系的音阶值添加至展示节奏序列生成展示音乐文件,并在接收到播放指令时,运行展示音乐文件。本发明结合地理特征和空气质量指数生成展示音乐文件,提升了空气质量的展示效果,使得用户在聆听音乐时也能够得到展示地点的相关信息。

    基于神经网络的歌词生成方法、装置、设备和存储介质

    公开(公告)号:CN109471951B

    公开(公告)日:2023-06-02

    申请号:CN201811093496.6

    申请日:2018-09-19

    摘要: 本发明涉及音频处理技术领域,尤其涉及一种基于神经网络的歌词生成方法、装置、设备和存储介质。基于神经网络的歌词生成方法包括:获取歌曲风格类型,从全集中搜索到对应的子集;获取特征词,生成对应的多个字或词;计算所述多个字或词为下一个词的概率,并结合歌词规则得到将要输出的词;判断其与前几个词之间的联系是否紧密,若判断为是则输出,若判断为否则重新生成新的词;获取歌词的字数要求,对将要输出的歌词进行字数判断,若字数符合则输出,若字数不符合则重新生成。本发明通过循环神经网络模型和马尔科夫模型自动生成歌词,生成的歌词之间逻辑关联性好,与用户所需歌词的主题密切相关。

    基于旋律的歌曲信息合成方法、装置、设备及存储介质

    公开(公告)号:CN113066459B

    公开(公告)日:2023-05-30

    申请号:CN202110311417.X

    申请日:2021-03-24

    IPC分类号: G10H1/00 G10L13/04 G10L25/30

    摘要: 本发明涉及人工智能技术领域,提供一种基于旋律的歌曲信息合成方法、装置、设备及存储介质,用于提高对歌曲信息合成的普适性。基于旋律的歌曲信息合成方法包括:获取包括对数幅度谱的预处理语音信息和目标旋律信息,通过目标歌唱合成模型中的编码器,分别对对数幅度谱和目标旋律轮廓进行音素编码处理,得到语音音素和旋律音素;通过目标歌唱合成模型中的跳跃连接网络,将语音音素和旋律音素传递至目标歌唱合成模型中的解码器,解码器包括转置的一维卷积核的上采样层;通过解码器,对语音音素和旋律音素依次进行合成、音素筛选和解码处理,得到目标歌曲信息。此外,本发明还涉及区块链技术,预处理语音信息和目标旋律信息可存储于区块链中。

    自动作曲方法、装置、计算机设备和存储介质

    公开(公告)号:CN109036355B

    公开(公告)日:2023-04-25

    申请号:CN201810715376.9

    申请日:2018-06-29

    IPC分类号: G10H1/38 G10H7/00

    摘要: 本发明涉及计算机技术领域,特别涉及一种自动作曲方法、装置、计算机设备和存储介质。所述方法包括:根据和声理论,对用户输入的三个以上起始音进行和弦分解及在和弦分解之后进行和弦转位;随机生成与和弦对应的四段琶音序列;根据预设作曲规则和歌曲类型,对四段琶音序列编配相应音乐要素,获得前奏、前间奏、尾间奏和尾奏;从音乐库中随机抽调一段与歌曲类型对应的旋律,获得主旋律;根据预设作曲规则对前奏、前间奏、尾间奏和尾奏中选取目标,将目标与主旋律按顺序拼接,生成一歌曲。不需要用户具备一定的音乐理论知识,用户就能作曲,旨在解决现有的自动编曲软件需要用户具备一定的音乐理论知识才可流畅使用的问题。

    基于语音识别的产品推荐方法及相关设备

    公开(公告)号:CN110223134B

    公开(公告)日:2022-10-28

    申请号:CN201910350108.6

    申请日:2019-04-28

    发明人: 王健宗 刘奡智

    摘要: 本发明公开了一种基于语音识别的产品推荐方法及相关设备,涉及机器学习领域,所述方法包括:获取用户对关于目标产品的预设问题的应答语音;提取所述应答语音的语音特征参数;基于声学模型及所述应答语音,确定所述用户的目标产品的标签;使用基于MAP算法的GMM‑UBM模型,结合所述语音特征参数,确定所述用户的性别及年龄范围;基于所述用户的目标产品的标签、和所述用户的性别及年龄范围,向所述用户推荐产品。所述方法提高了推荐产品的精准度。

    基于神经网络的佛教音乐记谱方法、装置、设备及介质

    公开(公告)号:CN113112969A

    公开(公告)日:2021-07-13

    申请号:CN202110308570.7

    申请日:2021-03-23

    摘要: 本发明用于人工智能领域,涉及区块链领域,公开了一种基于神经网络的佛教音乐记谱方法、装置、设备及介质,其中方法部分包括:获取需要转为乐谱的原始佛教音频数据,并转换为时频谱矩阵,获取包括音高识别模型的音高识别网络结构,获取包括唱词识别模型的唱词识别网络结构,将时频谱矩阵分别输入音高识别网络结构、唱词识别网络结构,以获得原始佛教音频数据的音高识别数据和唱词识别数据,根据音高识别数据与唱词识别数据生成原始佛教音频数据的简谱;本发明利用迁移学习技术,以预训练的音高识别模型和语音转文字模型作为基础,能自动识别出佛教音频的旋律和唱词以获得简谱,降低了佛教音乐记谱的时间成本,提高了佛教音乐记谱的效率。

    音乐文件生成方法、装置、设备及存储介质

    公开(公告)号:CN113010730A

    公开(公告)日:2021-06-22

    申请号:CN202110301209.1

    申请日:2021-03-22

    摘要: 本发明涉及人工智能领域,公开了一种音乐文件生成方法、装置、设备及存储介质。方法包括:接收输入的若干句歌词和目标时长;选择一句歌词作为目标歌词,从预置语法库中选择目标歌词对应的乐句片段类并确定乐句片段类对应的抽象乐句片段;确定待生成乐句对应的每个音符及各音符对应的音高和时值;根据目标歌词及待生成乐句对应的每个音符的音高和时值,生成目标歌词对应的乐句;若当前已生成乐句构成的乐曲时长与目标时长的差值未达到预置阈值范围则继续进行乐句生成,否则按预置音乐格式,输出由所有乐句构成的目标音乐文件。本发明可根据输入的音乐类型随机生成出符合输入的歌词和时长需求的音乐文件,满足了用户对音乐的个性化需求。

    一种音乐风格的转换方法、装置及终端设备

    公开(公告)号:CN110246472A

    公开(公告)日:2019-09-17

    申请号:CN201910385803.6

    申请日:2019-05-09

    IPC分类号: G10H1/00

    摘要: 本发明提供了一种音乐风格的转换方法、装置及终端设备,适用于数据处理技术领域,该方法包括:获取关于原始音频数据的第一乐器数字接口MIDI文件;解析第一MIDI文件所包含的音符元素,并通过预设算法对音符元素的音高值进行编码处理,得到第一编码;获取关联原始音乐调式以及目标音乐调式的编码映射关系表;基于编码映射关系表确定第一编码对应的第二编码,并对第二编码进行解码处理,以确定第二编码的音高值;生成关于各个第二编码的音高值的第二MIDI文件,并根据第二MIDI文件得到目标音频数据。本发明中,由于用户无需再根据自己的创作能力来手动改变音频数据的音乐风格,因此,实现了音乐风格的自动化转换,提高了音乐风格迁移的灵活性以及准确性。