一种基于自监督学习的婴儿哭声分类方法

    公开(公告)号:CN117995224A

    公开(公告)日:2024-05-07

    申请号:CN202410126038.7

    申请日:2024-01-30

    IPC分类号: G10L25/66 G10L25/51 G10L25/30

    摘要: 本发明公开了一种基于自监督学习的婴儿哭声分类方法,首先获取婴儿哭声的无标签音频数据和有标签音频数据,其次,建立上游自监督网络模型,将婴儿哭声的无标签音频数据输入上游自监督网络模型进行训练;接着建立下游分类模型,将训练好的上游自监督网络模型引入下游分类模型,形成自监督学习的分类模型;然后将婴儿哭声的有标签音频数据输入自监督学习的分类模型进行训练;最后将待进行分类的婴儿哭声音频数据输入至训练好的自监督学习的分类模型进行哭声识别。本发明能够利用无标签的婴儿哭声数据,优化婴儿哭声分类算法,提高婴儿哭声分类算法的性能。

    一种通过视频检测婴儿心率的方法

    公开(公告)号:CN117877090A

    公开(公告)日:2024-04-12

    申请号:CN202410016064.4

    申请日:2024-01-05

    摘要: 本发明公开了一种通过视频检测婴儿心率的方法,通过人工数据合成、深度神经网络、婴儿检测、波形分析的方法,将婴儿视频中所包含的心率信号精准地提取出来,融合编码解码器模型与相关的检测和数据分析技术,搭建出一套基于深度学习的针对婴儿的视频高精度框架。同时对婴儿人脸进行多点安全特征匹配采样用于解决目前婴儿人脸大小变化时拍摄到非皮肤区域导致颜色变化过大的问题,并增加夜视功能,从而实现了视频高精度检测婴儿心率,可用于临床诊断,婴儿状态监控。