一种基于多模态处理的音视频传输系统

    公开(公告)号:CN118694752A

    公开(公告)日:2024-09-24

    申请号:CN202411170581.3

    申请日:2024-08-26

    摘要: 本发明涉及音视频传输技术领域,尤其涉及一种基于多模态处理的音视频传输系统,包括:端口数据获取模块,其用以获取当前会话环境的各用户端信息;测试模块,用以通过传输测试获取各用户端的可用传输阈值;环境识别模块,其用以获取当前会话环境的维护模态以及确定对各用户端的传输匹配结果;数据流驱动模块,用以确定传输流分配比例、确定各模态数据流的压缩比例以及基于会话环境的维护模态的调整,更新所述压缩比例;本发明通过基于多模态数据的各客户端间的传输速度差异、数据量差异,调整音视频传输压缩方式,能够将同一会话环境中的各用户端的多模态数据的传输数据量通过压缩比例设定进行调整,保证各模态数据的传输同步性。

    一种视频处理方法及相关设备
    2.
    发明公开

    公开(公告)号:CN118540541A

    公开(公告)日:2024-08-23

    申请号:CN202311061487.X

    申请日:2023-08-22

    摘要: 本申请提供了一种视频处理方法,该方法应用于云桌面系统,包括云桌面客户端接收视频数据包,上述视频数据包记录有云桌面服务端对业务场景中的指令的执行结果,上述业务场景中的指令由用户通过云桌面客户端输入;云桌面客户端对视频数据包进行解码,获得第一视频,上述第一视频包含至少一个视频帧;云桌面客户端根据网络状态和业务场景确定上述至少一个视频帧的抖动时延,上述至少一个视频帧的抖动时延指示上述至少一个视频帧何时被用于播放;云桌面客户端按照上述至少一个视频帧的抖动时延将第一视频用于播放。该方法能够结合业务场景对云桌面响应视频进行抖动控制,从而满足用户使用云桌面时不同业务场景下对流畅性和实时性的要求。

    语音通话方法、终端和存储介质

    公开(公告)号:CN117478818B

    公开(公告)日:2024-08-23

    申请号:CN202311799935.6

    申请日:2023-12-26

    发明人: 武臻尧 吴馨怡

    IPC分类号: H04N7/14 H04W4/12 H04L65/40

    摘要: 本申请公开了一种语音通话方法、终端和存储介质,属于终端技术领域。该方法包括:若终端检测到语音通话操作,则在虚拟视频功能处于开启状态的情况下,获取人像图像,以及获取远端通话设备发送的语音数据;根据获取到的语音数据驱动该人像图像,得到虚拟视频;在语音通话过程中显示该虚拟视频。本申请中的该虚拟视频中的人像可以模拟出远端用户在发出相应语音时的体姿。如此,在语音通话过程中,用户通过观看该虚拟视频可以直观的感受到远端用户的表达,从而可以提高语音通话的灵活性,提高用户的语音通话体验。

    直播连麦处理方法及其装置、设备、介质

    公开(公告)号:CN115996213B

    公开(公告)日:2024-08-16

    申请号:CN202211726350.7

    申请日:2022-12-29

    发明人: 吴建

    摘要: 本申请涉及网络直播连麦技术领域中一种直播连麦处理方法及其装置、设备、介质、产品,所述方法包括:响应主播用户端推送的主播连麦请求,获取目标主播连麦特征信息,将目标主播连麦特征信息推送至匹配连麦池及邀约连麦服务;根据目标主播连麦特征信息,从匹配连麦池中匹配出对应的多个主播连麦特征信息,向各主播连麦特征信息的用户端推送连麦匹配请求;向由邀约连麦服务推送的邀约用户列表中多个平台用户的用户端推送连麦邀约请求;根据用户端推送的连麦匹配结果或连麦邀约结果,基于连麦结果优先级处理策略,确定出时间优先级最高的接受连麦用户端,开启接受连麦用户端与主播用户端的直播连麦业务。本申请可提升直播平台中用户的连麦效率。

    病房呼叫的灾备方法及装置、系统、电子设备及存储介质

    公开(公告)号:CN118449933A

    公开(公告)日:2024-08-06

    申请号:CN202310089573.5

    申请日:2023-02-03

    发明人: 胡文波 金浩

    摘要: 本发明公开了一种病房呼叫的灾备方法及装置、系统、电子设备及存储介质,属于医院呼叫技术领域。其中,该方法包括:监测业务服务器是否发生通信异常,其中,所述业务服务器通信连接病患区域的呼叫发起设备和医护区域的呼叫接收设备;若所述业务服务器发生通信异常,从所述呼叫发起设备本地读取所述呼叫接收设备的目标通信地址;基于所述目标通信地址创建所述呼叫发起设备与所述呼叫接收设备之间的直连通信链路;采用所述直连通信链路在所述呼叫发起设备和所述呼叫接收设备之间传输业务数据。通过本发明,解决了相关技术的病房呼叫系统在业务服务器异常时无法使用呼叫功能的技术问题,保证了病房呼叫系统的通信稳定性。

    一种基于人工智能的机器人控制方法

    公开(公告)号:CN116945191B

    公开(公告)日:2024-08-02

    申请号:CN202311164021.2

    申请日:2023-09-11

    摘要: 本公开关于一种基于人工智能的机器人控制方法,机器人内置有平行光发生器,方法包括:响应于目标对象发出的语音指令,通过平行光发生器产生的平行光束,在目标平面上确定第一指令范围,以提示目标对象在第一指令范围内作出手势指令,其中,第一指令范围为平行光束在目标平面上的入射范围;响应于目标对象作出的手势指令,在目标平面上确定第二指令范围,然后利用视觉识别模型在第二指令范围内确定目标平面上是否存在待识别的文本内容,在第二指令范围内存在待识别的文本内容的情况下,获取包含待识别的文本内容的文本图像,并利用文本识别模型对文本图像中的字符进行识别操作,得到目标文本,从而针对目标文本进行朗读操作。

    多媒体播放方法、云服务器、系统及存储介质

    公开(公告)号:CN113595976B

    公开(公告)日:2024-07-30

    申请号:CN202110660966.8

    申请日:2021-06-15

    发明人: 裘良科

    IPC分类号: H04L65/60 H04L65/40 H04L67/10

    摘要: 本申请实施例提供一种多媒体播放方法、云服务器、系统及存储介质。在本申请实施例中,终端设备与云服务器相互配合进行多媒体内容的播放,云服务器负责多媒体内容的流化处理,得到适合终端设备播放的流化后的多媒体内容,而终端设备负责对流化后的多媒体内容进行播放处理;在云端流化过程中,云服务器针对符合设定条件的多媒体内容进行局部流化,得到适合终端设备播放的流化后的多媒体内容,而不是执行全局流化,这不仅可以保证终端设备能够成功播放流化后的多媒体内容,而且还可以简化流化操作,节约流化操作所消耗的云端资源。

    一种面试评估方法及系统

    公开(公告)号:CN114531491B

    公开(公告)日:2024-07-26

    申请号:CN202111658814.0

    申请日:2021-12-31

    摘要: 本发明涉及远程交互技术领域,具体公开了一种面试评估方法及系统,所述方法包括接收面试端的面试请求,根据所述面试请求创建面试平台;建立所述面试平台与候选端之间的连接通道,开放候选端信号输入端口,实时获取候选端的输入信号;根据所述输入信号实时生成架构图,并将所述架构图向面试端和候选端发送;当接收到面试端的编辑请求时,开放面试端信号输入端口,实时获取面试端的输入信号;其中,当同时获取到候选端的输入信号和面试端的输入信号时,根据训练好的冲突解决模型进行信号处理。本发明相对于单纯的口头或是文字表述,能够以更为准确可靠的可视化方式呈现候选人的系统设计和软件架构能力。

    一种实现语音通信的组网系统

    公开(公告)号:CN118368274A

    公开(公告)日:2024-07-19

    申请号:CN202410793671.1

    申请日:2024-06-19

    摘要: 本发明公开了一种实现语音通信的组网系统,部署于通信终端,组网系统包括:音频处理模块:用于实现模拟语音信号与数字语音信号之间的转换;人机交互模块:用于向用户提供操作任务界面、通信状态界面,获取用户需求生成操作任务,操作任务包括语音转发任务;CPU处理模块:用于获取执行语音转发任务,实现语音转发任务逻辑控制;组网模块:用于支持与多个通信终端连接,实现语音通信;存储模块:用于实现语音信号、终端信息、设备运行日志存储。根据上述方案,采用国产CPU、国产音频编解码芯片执行音频处理和逻辑功能,在应用上为用户提供了便于使用的友好交互方式;在布局上定义由多种终端进行网状通信的模式,支持多种特种应用领域的定制场景。