图像生成方法、装置、电子设备、介质及计算机程序产品

    公开(公告)号:CN118799421A

    公开(公告)日:2024-10-18

    申请号:CN202410294146.5

    申请日:2024-03-14

    摘要: 本申请涉及图像处理技术领域,提供一种图像生成方法、装置、电子设备、介质及计算机程序产品,方法包括:获取图像生成的控制信息;控制信息包括控制图像与控制文本中的至少一项;控制图像包括线稿控制图像、姿态控制图像、分割控制图像、深度控制图像、整体结构控制图像、纹理细节控制图像与风格控制图像中的至少一种;基于随机噪声图像与控制文本进行图像去噪,得到去噪图像;根据去噪图像与至少一项控制图像,进行控制图像相应维度上特征距离的梯度计算,得到与控制图像相同数量的第一梯度值;基于各第一梯度值与去噪图像进行图像运算,得到目标图像。本申请可以提高图像生成的可控性。

    语义视频编解码方法、安防视频系统及存储介质

    公开(公告)号:CN118803263A

    公开(公告)日:2024-10-18

    申请号:CN202410010515.3

    申请日:2024-01-02

    发明人: 徐桦 谢小燕 付涛

    IPC分类号: H04N19/30 H04N19/137

    摘要: 本发明提供语义视频编解码方法、系统及存储介质,涉及视频编解码技术领域,所述方法包括:采集原始视频数据进行目标检测,获取第一基础语义层、目标增强层及背景层;每间隔预设时间值基于原始视频帧以及第一基础语义层生成语义关键帧;获取体验质量参数基于第一基础语义层以及目标增强层生成普通语义帧;根据相邻背景层的差异程度生成背景关键帧;根据语义关键帧、普通语义帧以及背景关键帧生成语义视频流;发送语义视频流。基于语义分析,将目标与背景作为不同层,通过不同方式编码,实现分层传输的效果,有利于提高编码灵活性,方同时考虑目标与背景之间的变化进行编码,有利于去除时序冗余信息,提高压缩率,减少发送端上传时的带宽占用。

    视频编码方法、装置、电子设备和存储介质

    公开(公告)号:CN118803244A

    公开(公告)日:2024-10-18

    申请号:CN202311523860.9

    申请日:2023-11-15

    摘要: 本申请涉及视频编码技术领域,提供了一种视频编码方法、装置、电子设备和存储介质,包括获取待编码视频,确定待编码视频的残差矩阵;根据残差矩阵的残差值对残差矩阵进行分级,得到基础矩阵和至少一稀疏矩阵,稀疏矩阵的位宽大于基础矩阵的位宽;分别对基础矩阵和每一稀疏矩阵进行编码,得到视频编码结果。本申请对残差矩阵进行分级存储,使得视频编码运算集中在低位宽的基础矩阵上,低位宽相比原来的标准位宽大大减少了等价的乘累加数,有效降低了运算复杂度;而稀疏矩阵变换时由于其稀疏特性,复杂度远远低于低位宽基础矩阵的运算复杂度。最终,新的算法显著减少了等价的乘累加数,降低了运算复杂度,加快了变换编码的速度。

    一种区域访问数据采集方法、装置、设备以及存储介质

    公开(公告)号:CN118158614A

    公开(公告)日:2024-06-07

    申请号:CN202211566433.4

    申请日:2022-12-07

    IPC分类号: H04W4/029 H04W24/10

    摘要: 本申请公开了一种区域访问数据采集方法,用以解决现有基于仿真基站的用户终端信息采集方法所存在的无法采集5G终端,采集过程中会导致用户终端设备掉线以及部署成本较高的问题。方法包括:基站响应于服务器下发的访问信息采集指令,向终端设备发送位置信息上报指令,其中,访问信息采集指令中携带有区域标识,位置信息上报指令用于指示终端设备上传位置信息;接收终端设备上传的位置信息;根据提取的所述终端设备的第一标识,生成位置测量报告,其中,所述位置测量报告中携带有所述区域标识、所述第一标识、所述位置信息以及测量时间;将所述位置测量报告上传至服务器。

    一种用于确定干扰源位置的方法
    5.
    发明公开

    公开(公告)号:CN117560101A

    公开(公告)日:2024-02-13

    申请号:CN202210932074.3

    申请日:2022-08-04

    摘要: 本申请公开了一种确定干扰源位置的方法,用以提高确定干扰源位置的准确性。本申请提供的方案包括:确定具备终端侧上行RSSI测量能力的多个用户设备;向多个用户设备分别发送测量控制消息,测量控制消息用于指示用户设备在特定状态对特定的频率资源进行终端侧的上行RSSI测量并上报;接收多个用户设备的测量结果,测量结果包括用户设备的位置信息、特定的频率资源信息、用户设备在处于特定状态时对用户设备的天线端口在特定的频率资源进行终端侧的上行RSSI测量得到的上行RSSI值;向MR服务器发送多个用户设备的测量结果,测量结果用于MR服务器确定在特定的频率资源的上行RSSI值最强的位置区域为特定的频率资源的干扰源位置。

    一种语义通信人脸重建优化方法、系统

    公开(公告)号:CN116684636B

    公开(公告)日:2023-10-13

    申请号:CN202310966321.6

    申请日:2023-08-01

    摘要: 本发明提供了一种语义通信人脸重建优化方法、系统,涉及图像处理与计算机视觉技术领域。本发明实施例中,在传输过程中,针对参考帧(第一帧)传输其图像、运动关键点、以及轮廓关键点,针对驱动帧(第一帧后续其他帧)的传输只需要传输运动关键点,传输成本大幅降低,而人脸重建过程中,以参考帧图像的轮廓关键点作为轮廓约束,可以在少量增加传输信息的情况下,提高人脸重建的稳定性和准确度,缓解了生成人脸变形的问题。从而可以在低传输成本的前提下,稳定准确地完成人脸重建。解决了传统语义信息传输方法由于信息少,会导致目标重建效果差,失真的情况的问题。

    一种基于语义通信的视频流媒体的QoE评估方法及装置

    公开(公告)号:CN116743609B

    公开(公告)日:2023-10-17

    申请号:CN202311013701.4

    申请日:2023-08-14

    摘要: 本申请提供了一种基于语义通信的视频流媒体的QoE评估方法及装置,首先通过语义通信解码端解码进行视频重建,生成重建视频流媒体。然后通过语义通信解码端获取重建视频流媒体的QoS表征,并确定其对应的基准QoE评分。同时,对重建视频流媒体中各个重建视频帧进行前景语义分析,得到对应的前景语义一致性表征,并比较相邻两个视频帧的前景语义一致性表征,得到QoE偏移量。最后通过语义通信解码端根据基准QoE评分和QoE偏移量,得到重建视频流媒体的QoE评分。其从服务质量和视频内容因素两方面考虑,根据QoS特征和语义特征对语义通信过程中产生的重建视频流媒体的体验质量QoE进行综合评估,使得结果更加真实、有效。