-
公开(公告)号:CN116778935A
公开(公告)日:2023-09-19
申请号:CN202311001125.1
申请日:2023-08-09
申请人: 北京百度网讯科技有限公司
IPC分类号: G10L19/018 , G10L19/02
摘要: 本公开提供了一种水印生成方法和装置、信息处理方法和装置、多模态信息检索方法、音频水印生成模型训练方法和装置,涉及人工智能技术领域,具体为深度学习、大模型、生成模型等技术领域。水印生成方法具体实现方案为:获取待处理素材;对待处理素材进行处理,得到待处理文本;将待处理文本输入音频水印生成模型,得到音频水印;音频水印生成模型用于表征输入文本与高频、无声的音频水印之间的对应关系。该实施方式提高了音频水印的生成效果。
-
公开(公告)号:CN117478964A
公开(公告)日:2024-01-30
申请号:CN202311412211.1
申请日:2023-10-27
申请人: 北京百度网讯科技有限公司
IPC分类号: H04N21/472 , H04N21/647 , H04N21/458
摘要: 本公开提供了视频倍速播放的方法和装置,涉及多媒体领域,尤其涉及视频处理领域。具体实现方案为:将视频分离成图像流和音频流;在图像流中每个单元时间内按预定比例丢弃相似的图像帧,得到新图像流;将所述音频流分帧得到的音频帧集合中相似的音频帧按预定比例进行叠加,得到新音频流;将新图像流和新音频流合并在一起,形成倍速后的视频。通过该实施方式倍速后的视频从视觉和听觉上都能够有自然流畅的用户体验。
-