-
公开(公告)号:CN216017039U
公开(公告)日:2022-03-11
申请号:CN202121223236.3
申请日:2021-06-02
Applicant: 南京艾伯瑞电子科技有限公司
Inventor: 郑辉
IPC: H04N21/439 , H04N21/233
Abstract: 一种多路音频接入并重采样装置,其包括两块SDI接口芯片、分别于两块SDI接口芯片电性连接的立体声音频数模转换芯片、与两块立体声音频数模转换芯片连接的音频解码芯片、与音频解码芯片连接的海思SOC;其中SDI接口芯片的型号为GV7604,所述立体声音频数模转换芯片型号为CS4344,所述音频解码芯片的型号为NVP1918C;本实用新型通过音频重采样电路,能有效消源端音频数字化时,由于源端与接收端采样时钟频率以及相位偏差而导致的滴答声,实现更流畅的音频信号接入,利用I2S的时分复用,将多路音频信号送入接收端,显著减少了接收端物理接口的数量,降低电路整体的复杂度。
-
公开(公告)号:CN207869239U
公开(公告)日:2018-09-14
申请号:CN201721880842.6
申请日:2017-12-28
Applicant: 天津益华微电子有限公司
Inventor: 杨利民
IPC: H04N5/262 , H04N5/265 , H04N5/268 , H04N5/272 , H04N5/278 , H04N7/10 , H04N19/42 , H04N19/44 , H04N19/70 , H04N21/2187 , H04N21/233 , H04N21/2343 , H04N21/4363
Abstract: 本实用新型提供一种便携式4K高清音视频直播系统,包括4K-HDMI延长发送器、4K音视频主播控制台,4K音视频主播控制台包括供电模块、4K音视频合成器模块以及与4K音视频合成器模块连接的4K-HDMI延长接收器模块、4K-H265编码器模块、4K直播码流传输控制器模块,4K高清摄像机通过HDMI线缆与4K-HDMI延长发送器电连接,4K-HDMI延长发送器通过以太网线缆与4K-HDMI延长接收器模块相连,4K-H265编码器模块与4K直播码流传输控制器模块电连接,4K直播码流传输控制器模块连上位机。本系统可以在保持高品质画质和音质的前提下,将直播设备缩小到一台手提电脑大小,满足中高端直播应用需求。(ESM)同样的发明创造已同日申请发明专利
-
公开(公告)号:CN119583906A
公开(公告)日:2025-03-07
申请号:CN202411692240.2
申请日:2024-11-22
Applicant: 平安科技(深圳)有限公司
IPC: H04N21/81 , H04N21/439 , H04N21/44 , H04N21/466 , H04N21/233 , H04N21/234 , H04N21/25
Abstract: 本申请实施例提供了一种人像视频生成方法和装置、电子设备及存储介质,属于图像处理技术领域,适用于金融科技场景。该方法包括:获取目标对象的样本音视频;其中,样本音视频包括目标人像视频帧和样本音频;对样本音频进行音频特征提取,得到样本音频特征;根据目标人像视频帧进行头部特征提取,得到目标头部特征;根据目标人像视频帧、样本音频特征和目标头部特征对预设视频生成模型进行训练,得到目标视频生成模型;获取目标对象的目标音频,基于目标视频生成模型、目标头部特征和目标音频对目标对象进行人像视频生成。本申请实施例能够通过音频生成画面自然的人像视频。
-
公开(公告)号:CN119583849A
公开(公告)日:2025-03-07
申请号:CN202411735797.X
申请日:2024-11-29
Applicant: 深圳市瑞达翔科技有限公司
IPC: H04N21/2343 , H04N21/233 , H04N21/234 , H04N21/439 , H04N21/44 , H04N21/4402 , H04N21/236 , H04N21/242 , H04N21/43 , G10L21/01 , G10L21/0272 , G10L21/0356
Abstract: 本发明涉及视频数据处理技术领域,一种基于AI视觉感知的音视频同步降噪方法及系统,包括:对音频数据进行预处理,得到预处理音频数据;对所述预处理音频数据进行时频分析,得到语音特征集合及背景音特征集合;对视频数据进行降噪,得到初级降噪视频数据,对初级降噪视频数据进行视觉感知,得到视频特征集合;根据所述视频特征集合,对所述语音特征集合进行基于口型特征的时间轴修正操作,得到更新时间轴;根据更新时间轴及预构建的背景音适配度序列,对进度修正音频数据进行主动降噪操作,得到噪声修正音频数据;对噪声修正音频数据与初级降噪视频数据进行合并操作得到同步降噪音视频。本发明可提高视频中图像及声音的清晰程度。
-
公开(公告)号:CN119520851A
公开(公告)日:2025-02-25
申请号:CN202411588197.5
申请日:2024-11-08
Applicant: 安徽听见科技有限公司
IPC: H04N21/234 , H04N21/44 , H04N21/233 , H04N21/439 , H04N21/2368
Abstract: 本申请提出一种视频处理方法、装置、电子设备、存储介质及产品,该方法从待处理视频中获取音频数据和视频帧集合;对音频数据对应的音频文本进行敏感词语检测,确定音频文本中的目标敏感词语和目标敏感词语对应的时间信息,按照目标敏感词语对应的时间信息,对音频数据进行去敏处理,得到目标音频数据;确定视频帧集合中的各个视频帧的敏感内容区域,对敏感内容区域进行去敏处理,得到目标视频帧集合;将目标音频数据与目标视频帧集合合成的目标视频数据进行合并,得到去敏后的视频文件。本方案自动对音频数据内的敏感词语和各个视频帧中的敏感内容区域均进行去敏处理,降低了对视频进行去敏处理的人工成本,提高了对视频进行去敏处理的效率。
-
公开(公告)号:CN119520849A
公开(公告)日:2025-02-25
申请号:CN202411615816.5
申请日:2024-11-13
Applicant: 广州朗国电子科技股份有限公司
IPC: H04N21/233 , H04N21/234 , H04N21/2343 , H04N21/439 , H04N21/44 , H04N21/4402 , H04N7/01
Abstract: 本发明公开了一种基于HDMI2.0的视频传输处理方法,涉及视频处理技术领域,解决了现有技术中通过网络处理器发送共享内存中的图像数据,可能会存在多个图像数据同时发送,导致传输通道堵塞的问题,影响传输效率的技术问题;本发明对原始视频进行分割得到原始视频图像和原始视频音频,对原始视频图像和音频分别进行切割;分别对图像片段和音频片段进行编码,得到图像标识和音频标识;分别计算图像片段和音频片段的优先级;根据图像片段和音频片段的优先级依次进行传输;客户端对接收到的图像片段和音频片段进行排序重组,并检测排序重组后的视频是否声画同步,对不同步的视频进行修正;能够避免出现传输通道堵塞,有利于提高传输效率。
-
公开(公告)号:CN119496958A
公开(公告)日:2025-02-21
申请号:CN202411620125.4
申请日:2024-11-13
Applicant: 广州友友传媒科技有限公司
Inventor: 吴文刚
IPC: H04N21/472 , H04N21/233 , H04N21/234 , H04N21/439 , H04N21/44 , H04N21/845
Abstract: 本发明提供一种智能化图像剪切调节式视频编辑软件系统,包括视频信息确定单元、视频信息获取单元、视频信息添加单元以及视频信息更新单元;所述视频信息确定单元用于在用户播放视频文件时,若接收到视频画面筛选指令,则从所述视频文件中确定出目标视频画面,并通过进一步数据信息确认,在所述目标视频画面中确定出待编辑区域;所述视频信息获取单元用于获取目标对象,用于进行视频编辑;所述视频信息添加单元用于将所述目标对象添加到所述目标视频画面的待编辑区域;所述视频信息更新单元用于采用添加了所述目标对象的目标视频画面,实际应用中,可以较好的实现对视频信息的可调节式剪切编辑,满足用户对视频处理的自动化、智能化需求。
-
公开(公告)号:CN119496920A
公开(公告)日:2025-02-21
申请号:CN202311054343.1
申请日:2023-08-21
Applicant: 炬芯科技股份有限公司
IPC: H04N21/233 , H04N21/439
Abstract: 本申请实施例提供了一种采样率转换系统、方法以及装置,该系统包括:ASRC节点,用于对输入样点进行采样率转换得到输出样点,并将输出样点传输给缓存节点;缓存节点,用于对ASRC节点传输的输出样点进行缓存;监测节点,用于监测缓存节点中的输出样点的缓存数量,并将缓存数量发送给控制节点;控制节点,用于在缓存数量首次达到预设基准数量后,控制缓存节点以预设输出采样率将输出样点输出;控制节点,还用于在控制缓存节点以预设输出采样率将输出样点输出之后,基于缓存数量,确定目标抽取率,并将目标抽取率发送给ASRC节点;ASRC节点,还用于基于目标抽取率进行抽取率调整。保证了输出样点的输出稳定性,减少因传输阻塞而导致的卡顿现象。
-
公开(公告)号:CN119484947A
公开(公告)日:2025-02-18
申请号:CN202411606840.2
申请日:2024-11-11
Applicant: 上海哔哩哔哩科技有限公司
IPC: H04N21/81 , G06F16/738 , G06V20/40 , G06V20/30 , G06N20/00 , G06F16/783 , G06F16/78 , H04N21/488 , H04N21/439 , H04N21/44 , H04N21/234 , H04N21/233
Abstract: 本申请实施例公开了一种视频标题生成方法及装置。其中,方法包括:获取待处理视频中的多模态数据,其中,多模态数据包含:视频帧及音频数据;根据多模态数据确定视频标题提示关键词,并根据视频标题提示关键词,生成视频标题提示信息,将视频标题提示信息及多模态数据输入至预先训练的多模态大语言模型,生成待处理视频对应的视频标题。由此,可以利用多模态大语言模型结合视频内容的多模态数据自动生成视频标题,使得所生成的视频标题与视频内容高度契合,所生成的视频标题既能准确反映视频内容又能吸引用户点击,从而提高了视频稿件的生产效率及分发效果,提升用户体验度,同时还节省了人力物力成本。
-
公开(公告)号:CN119450298A
公开(公告)日:2025-02-14
申请号:CN202310955279.8
申请日:2023-07-31
Applicant: 北京字跳网络技术有限公司
IPC: H04R1/32 , H04S7/00 , H04N21/439 , H04N21/233 , H04N21/2187
Abstract: 本公开实施例提供了一种音频处理方法、装置、电子设备以及存储介质。所述方法包括检测目标音频数据的目标音源位置,依据所述目标音源位置确定所述目标麦位对应的目标空间音频坐标,采用所述目标空间音频坐标对所述目标麦位对应的目标音频数据进行调整并输出。本方案提升了动态空间音频效果。
-
-
-
-
-
-
-
-
-