基于互联网的音视频识别系统
    2.
    发明公开

    公开(公告)号:CN118573916A

    公开(公告)日:2024-08-30

    申请号:CN202410653553.0

    申请日:2024-05-24

    摘要: 本发明属于音视频识别技术领域,尤其是一种基于互联网的音视频识别系统,针对现有的音视频识别系统在使用过程中,不便于对音视频内容进行实时智能识别监管,从而导致音视频内容质量无法得到保障的问题,现提出如下方案,其包括互联网模块;采集模块,所述采集模块与互联网模块连接,所述采集模块连接有信号处理模块,信号处理模块连接有特征提取模块,所述特征提取模块连接有分类模块,所述分类模块连接有智能识别模块;获取模块,所述获取模块连接有传输模块,所述传输模块连接有数据库模块,所述数据库模块连接有管理模块,本发明能够在使用过程中,便于对音视频内容进行实时智能识别监管,从而可以有效保障音视频内容质量。

    一种特定场景语音内容识别优化方法

    公开(公告)号:CN117095673A

    公开(公告)日:2023-11-21

    申请号:CN202310830037.6

    申请日:2023-07-07

    摘要: 本发明涉及语音识别领域,尤其为一种特定场景语音内容识别优化方法,包括如下步骤:包括如下步骤:S1:使用网络爬虫技术对网络中特定场景的语音进行爬取,获得初始语音数据;S2:提取初始语音数据并对初始语音数据进行数据预处理获得预处理数据;S3:通过卷积神经网络训练实用模型,对预处理数据进行语音识别并生成初始文本;S4:使用文本规范算法对初始文本进行文本润色保证输出最终文本的正确性。本发明通过对获取的语音进行预处理起到数据增强的作用保证了数据不失真,在获取到不失真的数据后对其进行特征提取确保了工作速度,对提取出的初始文本进行文本规范算法用常见的文本代替初始文本中出现的非人类语言,保证最后出现的文本不会出现错误。