一种OCR识别乐谱的方法与装置
    1.
    发明公开

    公开(公告)号:CN117197821A

    公开(公告)日:2023-12-08

    申请号:CN202311223445.1

    申请日:2023-09-21

    发明人: 杨沛

    摘要: 本发明公开了一种OCR识别乐谱的方法与装置,该方法首先对输入的乐谱图像进行水平校正,确保乐谱的线条水平,同时通过形态学变换、灰度化、去噪、滤波和二值化等一系列图像处理技术,提高图像的清晰度。接着,基于y轴的1维向量,对乐谱图像进行字符分割,并利用边缘检测算法进一步提取字符边缘。为了分类乐谱中的各种字符,方法涉及到对tab线、旋律、歌词、节奏线、指板和和弦等关键元素的定位和分类。字符的识别主要基于深度学习中的神经网络技术,如卷积神经网络(CNN)和长短时记忆网络(LSTM),实现对简谱数字、和弦名称等的高准确度识别。最终,识别出的乐谱信息将以文本格式输出,为后续音乐分析和应用提供准确数据。

    旋律识别及其模型训练方法、程序产品、设备及存储介质

    公开(公告)号:CN118824216A

    公开(公告)日:2024-10-22

    申请号:CN202411297120.2

    申请日:2024-09-18

    发明人: 杨沛

    IPC分类号: G10H1/00

    摘要: 本申请涉及音频处理技术领域,具体提供旋律识别及其模型训练方法、程序产品、设备及存储介质。该旋律识别模型训练方法通过对待训练音频数据进行特征提取,将提取到的待训练特征数据输入到待训练旋律识别模型中,获得模型识别结果;并根据模型识别结果以及待训练音频数据的旋律标注结果,对待训练旋律识别模型的内部参数进行优化,获得经训练的旋律识别模型。由于该待训练旋律识别模型包括条件随机场模型,基于条件随机场模型能够有效地考虑到不同待训练特征数据之间的依赖关系,提高模型识别结果的准确性。基于该旋律识别模型训练方法所获得的旋律识别模型,对待识别的音频数据进行旋律识别,能够获得准确性更高的旋律识别结果。

    一种音乐旋律生成方法
    3.
    发明公开

    公开(公告)号:CN117198251A

    公开(公告)日:2023-12-08

    申请号:CN202311223447.0

    申请日:2023-09-21

    发明人: 杨沛

    IPC分类号: G10H1/00

    摘要: 本发明公开了一种音乐旋律生成方法,所述方法包括:已有歌曲音频进行转换成音高序列、进行音符分段,提取出主旋律,所述已有歌曲音频进行频谱分析,识别音频中的音高,提取出和声,所述已有歌曲音频进行特征提取,训练分类器,进行风格识别,所述已有歌曲音频进行特征提取,比较所述特征,确定出结构信息;将所述和声、风格信息和结构信息作为生成的模型条件,进行模型训练;所述模型结合音乐专家规则;所述模型训练完毕后可以根据和声、风格信息和结构信息来生成主旋律。本发明将“和声及歌曲结构”作为生成条件,在已经确定的和声的基础上,模型会在对应的歌曲结构部分生成对应的旋律,从而可控的生成一整首歌的旋律。