-
公开(公告)号:CN114071195B
公开(公告)日:2024-06-21
申请号:CN202110448478.0
申请日:2021-03-08
Applicant: 达音网络科技(上海)有限公司
Inventor: 钟声
IPC: H04N21/24 , H04N21/442 , H04N21/454
Abstract: 本发明提出了一种在实时通信中的内容审核方法,包括:从发送方用户处接收第一段媒体流;对第一段媒体流进行压缩以获得压缩后的第一段媒体流;将压缩后的第一段媒体流发送至集中式内容审核设备;从集中式内容审核设备处接收集中式鉴定,该鉴定表明第一段媒体流内容是否恰当;如果集中鉴定结果表明第一段媒体流内容为不恰当的,则对第一段媒体流进行模糊化处理以获得模糊后的第一段;并将模糊后的第一段媒体流发送给接收方用户。
-
公开(公告)号:CN111882026B
公开(公告)日:2023-11-24
申请号:CN202010283857.4
申请日:2020-04-13
Applicant: 达音网络科技(上海)有限公司
IPC: G06N3/0475 , G06N3/094 , G06T9/00
Abstract: 本发明提出了一种训练生成对抗网络(GAN)中的发生器G的方法,包括发生器G在接收到第一输入Z之后随即生成第一输出G(Z);GAN的编码器E在接收到第一输出G(Z)作为输入之后随即生成第二输出E(G(Z));G在接收到第二输出E(G(Z))作为输入之后随即生成第三输出G(E(G(Z)));E在接收到第三输出G(E(G(Z)))作为输入之后随即生成第四输出E(G(E(G(Z))));训练E最小化第二输出E(G(Z))和第四输出E(G(E(G(Z))))之间的差;以及使用第二输出E(G(Z))和第四输出E(G(E(G(Z))))来约束对发生器G的训练。G(Z)是Z的环境空间表示。E(G(Z))是G(Z)的潜在空间表示。G(E(G(Z)))是E(G(Z))的环境空间表示。E(G(E(G(Z))))是G(E(G(Z)))的潜在空间表示。
-
公开(公告)号:CN111861878B
公开(公告)日:2023-09-22
申请号:CN201911034227.7
申请日:2019-10-29
Applicant: 达音网络科技(上海)有限公司
Inventor: 钟声
IPC: G06T3/40 , G06N3/0475 , G06N3/094
Abstract: 本发明提出了一种训练生成对抗网络(GAN)中的生成器G的方法,包括由编码器E接收目标数据Y;由编码器E接收发生器G的输出G(Z),其中发生器G在接收作为噪声样本的随机样本Z后随即生成输出G(Z),GAN中的鉴别器D受到训练以区分G(Z)和目标数据Y两者中哪一个是真实数据;训练编码器E以最小化输出G(Z)的第一潜在空间表示E(G(Z))与目标数据Y的第二潜在空间表示E(Y)之间的差值,其中输出G(Z)和目标数据Y被输入到编码器E;并使用第一潜在空间表示E(G(Z))和第二潜在空间表示E(Y)来约束发生器G的训练。
-
公开(公告)号:CN113806213B
公开(公告)日:2023-07-14
申请号:CN202011125128.2
申请日:2020-10-20
Applicant: 达音网络科技(上海)有限公司
IPC: G06F11/36
Abstract: 本发明提出了一个高度可扩展的SDK自动测试系统,包括一个自动化测试控制器、一个自动化测试消息服务器和一个在一组目标设备上运行的自动化测试消息终端。该控制器和终端在消息服务器上为自己注册。编写一个测试用例,用于在多个目标设备上同时测试SDK,并将其转换为JSON消息格式的一组命令消息集。控制器将消息集发送到消息服务器。消息服务器随即将命令消息集分发到各终端。终端随即调用SDK中相应的API。目标设备集中的各个设备调用的API可以相同,也可以不同。SDK返回一个结果并且被转发至服务器。服务器将结果从目标设备发送到控制器。控制器验证结果。
-
公开(公告)号:CN112751820B
公开(公告)日:2023-03-10
申请号:CN202010493719.9
申请日:2020-06-03
Applicant: 达音网络科技(上海)有限公司
Inventor: 赵晓涵
IPC: H04L65/60 , H04L65/65 , H04L65/80 , G10L21/0224 , G10L21/0232
Abstract: 本发明提出了一种用于恢复音频流的当前帧的方法,包括:检测到当前数据包丢失,该当前数据包包括音频信号;将一个或多个帧分为相应的高频带信号和相应的低频带信号,该一个或多个帧在音频流中的当前帧之前;使用相应的低频带信号作为机器学习模型的输入来推断当前帧的当前低频带信号;将推断出的当前低频带信号与对应的高频带信号进行合并以获得当前帧;并将当前帧添加到播放缓冲区。
-
公开(公告)号:CN115623154A
公开(公告)日:2023-01-17
申请号:CN202210358545.4
申请日:2022-03-29
Applicant: 达音网络科技(上海)有限公司
IPC: H04N7/14 , H04N19/187 , H04N19/65 , H04N21/6375
Abstract: 本发明提供了一种用于恢复实时视频通信过程中网络视频数据丢包的参考序AL‑FEC系统,其包括分包器、参考序AL‑FEC编码器、参考序AL‑FEC解码器和解包器。分包器根据当前帧的源数据包构建源符号。编码器基于编码窗口内的帧之间的参考顺序,而不是时间顺序,从当前帧和其他参考帧的源符号中生成修复符号。编码器还基于修复符号生成修复数据包。解码器基于编码窗口中帧的源符号和通过对修复包进行解码获取的修复符号,恢复丢失的源符号。解码通过求解修复符号的线性方程来实现。
-
公开(公告)号:CN114765029A
公开(公告)日:2022-07-19
申请号:CN202110608545.0
申请日:2021-06-01
Applicant: 达音网络科技(上海)有限公司
IPC: G10L21/003 , G10L21/013 , G10L15/02 , G10L25/90
Abstract: 本发明提出了一种将样本语音帧转换为歌声帧的方法,包括:获得音频帧的音高值;使用该音高值获得该帧的共振峰信息;使用该音高值获得该帧的非周期性信息;获取主音音高以及和弦音高;使用共振峰信息、非周期性信息、主音音高以及和弦音高获得歌声帧;以及输出或保存歌声帧。
-
公开(公告)号:CN114071195A
公开(公告)日:2022-02-18
申请号:CN202110448478.0
申请日:2021-03-08
Applicant: 达音网络科技(上海)有限公司
Inventor: 钟声
IPC: H04N21/24 , H04N21/442 , H04N21/454
Abstract: 本发明提出了一种在实时通信中的内容审核方法,包括:从发送方用户处接收第一段媒体流;对第一段媒体流进行压缩以获得压缩后的第一段媒体流;将压缩后的第一段媒体流发送至集中式内容审核设备;从集中式内容审核设备处接收集中式鉴定,该鉴定表明第一段媒体流内容是否恰当;如果集中鉴定结果表明第一段媒体流内容为不恰当的,则对第一段媒体流进行模糊化处理以获得模糊后的第一段;并将模糊后的第一段媒体流发送给接收方用户。
-
公开(公告)号:CN112751820A
公开(公告)日:2021-05-04
申请号:CN202010493719.9
申请日:2020-06-03
Applicant: 达音网络科技(上海)有限公司
Inventor: 赵晓涵
IPC: H04L29/06 , G10L21/0224 , G10L21/0232
Abstract: 本发明提出了一种用于恢复音频流的当前帧的方法,包括:检测到当前数据包丢失,该当前数据包包括音频信号;将一个或多个帧分为相应的高频带信号和相应的低频带信号,该一个或多个帧在音频流中的当前帧之前;使用相应的低频带信号作为机器学习模型的输入来推断当前帧的当前低频带信号;将推断出的当前低频带信号与对应的高频带信号进行合并以获得当前帧;并将当前帧添加到播放缓冲区。
-
公开(公告)号:CN111431899B
公开(公告)日:2021-03-02
申请号:CN202010206221.X
申请日:2020-03-23
Applicant: 达音网络科技(上海)有限公司
Inventor: 何丰
Abstract: 本文为实时通信中诊断用户体验质量的系统和方法,提出了一套在实时通信监测和诊断计算机系统上提供实时通信监测和诊断的系统。该监测和诊断系统包括时间线、从参照线处向上延伸的视频下行比特率轴,从参照线处向下延伸的音频下行比特率轴,在参照线上方用第一种颜色标识的视频下行比特率曲线,在参照线下方用第二种颜色标识的音频下行比特率曲线,在参照线上方并沿参照线方向延伸的用第四种颜色标识的一组模糊视频指示符,以及在参照线下方并沿参照线方向延伸的用第五种颜色标识的一组模糊音频指示符。
-
-
-
-
-
-
-
-
-