-
公开(公告)号:CN118524215A
公开(公告)日:2024-08-20
申请号:CN202410768232.5
申请日:2024-06-14
申请人: 联通沃音乐文化有限公司
IPC分类号: H04N19/124 , H04N19/176 , H04N19/503 , H04N19/593 , H04N19/51 , G06N3/0464 , G06N3/044
摘要: 本发明提供了一种基于神经网络的H.264量化训练方法、设备和介质,方法包括:在编码控制中,将输入视频信号中的视频帧划分为若干个宏块,并进行特征提取,将提取得到的视频特征输入第一机器学习模型实时预测最佳编码参数;在预测编码中,进行帧内预测和帧间预测;在帧内预测中,对每个宏块及其相邻块进行特征提取,将特征输入到训练好的第二深度学习模型中,得到预测的宏块;在帧间预测中,使用第三深度学习模型对视频帧间的运动进行估计,生成运动矢量,并对当前宏块进行运动补偿,得到预测块;对运动补偿后的预测块与当前块进行比较,计算残差并进行编码。本发明通过深度学习技术显著优化了视频编码过程,不仅提高了编码效率,还保证了视频质量。
-
公开(公告)号:CN118505267A
公开(公告)日:2024-08-16
申请号:CN202410536460.X
申请日:2024-04-30
申请人: 联通沃音乐文化有限公司
IPC分类号: G06Q30/0201
摘要: 本发明涉及营销管理系统技术领域,具体为一种智慧商户营销管理系统及方法,包括客户管理模块,所述客户管理模块用于收集和管理客户信息提供客户细分和画像功能,所述客户管理模块电性连接有数据质量管理模块,所述数据质量管理模块用于清洗、整合和验证营销数据,确保数据的准确性和完整性,所述数据质量管理模块电性连接有智能分析模块。该智慧商户营销管理系统及方法解决了商户营销系统的数据收集和处理能力有限,导致数据不准确、不完整或过时,这影响了商户制定有效营销策略的能力以及商户可能同时使用多个营销工具或系统,但这些系统之间往往缺乏有效的集成,导致数据不互通,操作繁琐的问题。
-
公开(公告)号:CN118470278A
公开(公告)日:2024-08-09
申请号:CN202410940319.6
申请日:2024-07-15
申请人: 联通沃音乐文化有限公司 , 联通在线信息科技有限公司
IPC分类号: G06T19/20 , G06F3/04815 , G06F3/0484 , G06F3/0486
摘要: 本发明公开了一种用于拖拉拽编辑工具的虚拟场景控制方法及系统,涉及虚拟XR技术领域,通过步骤S1至步骤S5,通过将虚拟场景划分为多个独立的层次,能够实现对各层次的精细化管理,提升了系统的模块化和可维护性,并为每个层次分配相应的资源,各层次在初始化时具备所需资源,优化了场景加载速度和系统响应能力,动态控制各层次的可见性和内容更新,根据用户操作和系统事件实时调整场景内容,增强了用户的互动体验和系统的灵活性,通过信息传递实现层次之间的状态同步,确保了各层次的协同工作和场景的一致性,避免了传统方法中的信息滞后和不一致问题,通过对各层次的资源利用率进行评估,系统能够有效地优化资源分配、降低负载和提升整体性能。
-
公开(公告)号:CN118337983A
公开(公告)日:2024-07-12
申请号:CN202410371299.5
申请日:2024-03-29
申请人: 联通沃音乐文化有限公司 , 联通在线信息科技有限公司
摘要: 本发明涉及视频彩铃技术领域,具体为一种基于新通信平台的超高清分辨率视频彩铃审核方法,包括如下步骤:步骤一,接收用户上传的超高清分辨率视频彩铃。步骤二,对视频彩铃进行格式和分辨率检测。步骤三,自动审核:利用人工智能技术对视频彩铃进行自动审核。步骤四,人工审核:对于自动审核未通过的视频彩铃。步骤五,审核结果反馈。该基于新通信平台的超高清分辨率视频彩铃审核方法通过上述操作步骤解决了现有系统主要支持标清和高清视频的审核,我们需要对系统进行优化,以支持超高清分辨率的视频审核的问题。
-
公开(公告)号:CN117278710B
公开(公告)日:2024-06-25
申请号:CN202311366650.3
申请日:2023-10-20
申请人: 联通沃音乐文化有限公司 , 联通在线信息科技有限公司
IPC分类号: H04N7/14 , H04M1/72454 , H04M1/72439 , H04L65/1066 , G10L15/26
摘要: 本申请涉及通信技术领域,尤其涉及一种通话交互功能确定方法、装置、设备和介质,方法包括:当检测到视频通话功能开启时,获取视频通话页面中的通话环境图;对通话环境图进行识别,确定通话场景标识信息,再基于通话场景标识信息,确定通话环境图的通话场景信息;若通话场景信息为未确定通话场景类别,则获取视频通话语音,并基于视频通话语音确定通话场景类别;基于通话场景类别确定目标交互功能,并在视频通话页面显示目标交互功能。本申请可以为用户提供更准确的目标交互功能。
-
公开(公告)号:CN118135152A
公开(公告)日:2024-06-04
申请号:CN202311720879.2
申请日:2023-12-14
申请人: 联通沃音乐文化有限公司
摘要: 本发明涉及AR植入虚实融合处理技术领域,且公开了一种XR系统中AR植入的虚实融合处理方法,虚实融合处理方法步骤包括:S1、通过深度摄像头、传感器环境感知技术来实现环境的感知数据载入;S2、根据载入的环境感知数据生成虚拟内容;S3、基于陀螺仪、加速度计传感器追踪用户姿态数据,获取用户头部的旋转信息;S4、利用头部旋转信息,计算视角校正所需的视角矩阵和投影矩阵;S5、根据真实场景的光照条件和虚拟物体的位置、材质信息,使用实时渲染技术模拟虚拟物体的光照和阴影效果;S6、通过调整虚拟物体的渲染参数,缩放因子、视距补偿来实现透视校正。
-
公开(公告)号:CN118118614A
公开(公告)日:2024-05-31
申请号:CN202410028772.X
申请日:2024-01-09
申请人: 联通沃音乐文化有限公司 , 联通在线信息科技有限公司
IPC分类号: H04N7/14 , H04N5/272 , H04N21/431 , H04N21/4788 , H04N21/485 , H04L65/403 , H04L65/1094
摘要: 本发明公开了一种基于物联网的5G新通话APP及其视频通话系统,属于视频通话系统技术领域,包括通讯录读取模块、通讯录管理模块、通话管理模块和通话互动模块,所述通话模块包括通话浮窗开启模块、通话背景切换模块、屏幕共享模块和白板开启模块。本发明中,通过设置通话模块,通话浮窗开启模块在通话中开启浮窗,在原生通话的过程中,支持通话信令触发的方式拉起悬浮窗,通过浮窗可快速进入APP进行通话互动,屏幕共享模块持用户在通话中进行屏幕共享,共享后通话中的其他成员可看见共享者的手机屏幕,通话中的其他成员也可看见,在沟通交流过程中遇见问题也能够通过文字和图画进行演示,极大的提高了视频通话的沟通效率。
-
公开(公告)号:CN118071935A
公开(公告)日:2024-05-24
申请号:CN202410377361.1
申请日:2024-03-29
申请人: 联通沃音乐文化有限公司
IPC分类号: G06T17/00 , G06T15/00 , G06V40/16 , G06V40/20 , G06V20/64 , G06V10/82 , G06N3/0475 , G06N3/094
摘要: 本发明公开了一种面向元宇宙的3D数字人生成方法,属于数字人生成领域,包括以下步骤:S1、获取目标对象图片;S2、基于人工智能生成技术,对获取的目标对象图片进行3D人脸重建,生成初始3D人脸模型;S3、基于智能驱动算法,对所述初始3D人脸模型对应的驱动方式进行调整,得到配置有驱动方式的3D人脸模型;S4、对配置有驱动方式的3D人脸模型,进行云渲染,输出目标对象的目标3D人脸模型。本发明的3D数字人生成方法基于3D人脸重建,AI语音、视觉驱动算法,实现了3D数字人快速智能生成、智能驱动功能。
-
公开(公告)号:CN118055208A
公开(公告)日:2024-05-17
申请号:CN202410028666.1
申请日:2024-01-09
申请人: 联通沃音乐文化有限公司 , 联通在线信息科技有限公司
IPC分类号: H04N7/14 , H04N5/272 , H04N21/478 , H04N21/482 , H04N21/4788 , H04N21/488 , H04N21/485
摘要: 本发明公开了一种基于物联网的5G新通话APP及其处理系统,属于5G新通话APP技术领域,APP包括EPG管理模块、EPG视频制作模块、EPG菜单模块和通话背景设置模块,EPG菜单模块包括视频通话模块、视频号模块、元宇宙模块、监控模块、商城模块和Vlog模块,通话背景设置模块包括虚拟背景植入模块、通话背景开启模块、XR特效模块、翻译转写模块和背景虚化模块。本发明中,通过设置虚拟背景植入模块,利用拍摄模块调起用户相机进行拍摄或调出用户再本地上传的视频,剪辑制作后可设置为视频彩铃、视频背景,能够自由制作想要的背景,在双方开启通话的过程中开启自己想要的背景,能够大大提高通话的趣味性和体验度。
-
公开(公告)号:CN117915000A
公开(公告)日:2024-04-19
申请号:CN202311803517.X
申请日:2023-12-26
申请人: 联通沃音乐文化有限公司
IPC分类号: H04M3/42 , H04L51/046
摘要: 本发明公开基于统一数据库的新通话方法及系统,系统包括集中管理平台和新通话平台,所述集中管理平台包括统一数据库,所述统一数据库用于存储新通话的用户信息和用户设置信息;所述新通话平台包括功能处理模块、信令处理模块和媒体处理模块等。本发明通过统一数据库来存放全网用户的新通话信息,各放音平台不需要存储用户的新通话信息,放音平台直接通过实时消息到新通话存储系统获取用户信息,然后根据获取到的信息给用户放新通话,这样解决数据不一致和资源浪费的问题。放音平台通过实时消息到全网统一数据库获取新通话信息,采用和信令处理并发的方式进行,以解决获取新通话信息产生时延对用户感知上的影响。
-
-
-
-
-
-
-
-
-