-
公开(公告)号:CN118799421A
公开(公告)日:2024-10-18
申请号:CN202410294146.5
申请日:2024-03-14
申请人: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
摘要: 本申请涉及图像处理技术领域,提供一种图像生成方法、装置、电子设备、介质及计算机程序产品,方法包括:获取图像生成的控制信息;控制信息包括控制图像与控制文本中的至少一项;控制图像包括线稿控制图像、姿态控制图像、分割控制图像、深度控制图像、整体结构控制图像、纹理细节控制图像与风格控制图像中的至少一种;基于随机噪声图像与控制文本进行图像去噪,得到去噪图像;根据去噪图像与至少一项控制图像,进行控制图像相应维度上特征距离的梯度计算,得到与控制图像相同数量的第一梯度值;基于各第一梯度值与去噪图像进行图像运算,得到目标图像。本申请可以提高图像生成的可控性。
-
公开(公告)号:CN118803263A
公开(公告)日:2024-10-18
申请号:CN202410010515.3
申请日:2024-01-02
申请人: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: H04N19/30 , H04N19/137
摘要: 本发明提供语义视频编解码方法、系统及存储介质,涉及视频编解码技术领域,所述方法包括:采集原始视频数据进行目标检测,获取第一基础语义层、目标增强层及背景层;每间隔预设时间值基于原始视频帧以及第一基础语义层生成语义关键帧;获取体验质量参数基于第一基础语义层以及目标增强层生成普通语义帧;根据相邻背景层的差异程度生成背景关键帧;根据语义关键帧、普通语义帧以及背景关键帧生成语义视频流;发送语义视频流。基于语义分析,将目标与背景作为不同层,通过不同方式编码,实现分层传输的效果,有利于提高编码灵活性,方同时考虑目标与背景之间的变化进行编码,有利于去除时序冗余信息,提高压缩率,减少发送端上传时的带宽占用。
-
公开(公告)号:CN114821730A
公开(公告)日:2022-07-29
申请号:CN202210506615.6
申请日:2022-05-10
申请人: 中移(杭州)信息技术有限公司 , 中国移动通信集团有限公司
IPC分类号: G06V40/16 , G06V10/774
摘要: 本发明公开了一种人脸识别方法、装置、设备及计算机可读存储介质,人脸识别方法包括:确定预训练集中的可见光样本和近红外样本,根据所述可见光样本和所述近红外样本进行模型训练,得到图像转换生成模型;获取目标可见光样本,并将所述目标可见光样本输入至所述图像转换生成模型进行模型训练,得到目标近红外样本;根据所述目标可见光样本和目标近红外样本进行成对数据混合增加,得到目标样本集,并根据所述目标样本集对预设的人脸识别网络进行模型训练,得到人脸识别模型;将待识别的近红外人脸图像输入至所述人脸识别模型进行人脸识别。本发明提高了跨光谱人脸识别的准确性。
-
公开(公告)号:CN117292245A
公开(公告)日:2023-12-26
申请号:CN202310964759.0
申请日:2023-08-02
申请人: 清华大学 , 中移(杭州)信息技术有限公司
摘要: 本申请提供了一种面向人脸语义编解码的人脸图像的质量评估方法和系统,该方法应用于图像质量评估技术领域,该方法包括:解码端根据编码端发送的参考人脸图像和当前原始人脸图像的关键点,进行图像重建,生成当前重建人脸图像;解码端通过关键点检测模型获得当前重建人脸图像的关键点;解码端将当前重建人脸图像的关键点和当前原始人脸图像的关键点进行比较,得到当前重建人脸图像的人脸形状偏移指标值;解码端将当前重建人脸图像和参考人脸图像进行相似度比较,得到当前重建人脸图像的人脸身份偏移指标值;解码端基于人脸身份偏移指标值、人脸形状偏移指标值以及预设指标值,得到当前重建人脸图像的质量评估结果。
-
公开(公告)号:CN116743609B
公开(公告)日:2023-10-17
申请号:CN202311013701.4
申请日:2023-08-14
申请人: 清华大学 , 中移(杭州)信息技术有限公司
IPC分类号: H04L41/5067 , H04L41/5009 , H04N21/44 , H04N21/647
摘要: 本申请提供了一种基于语义通信的视频流媒体的QoE评估方法及装置,首先通过语义通信解码端解码进行视频重建,生成重建视频流媒体。然后通过语义通信解码端获取重建视频流媒体的QoS表征,并确定其对应的基准QoE评分。同时,对重建视频流媒体中各个重建视频帧进行前景语义分析,得到对应的前景语义一致性表征,并比较相邻两个视频帧的前景语义一致性表征,得到QoE偏移量。最后通过语义通信解码端根据基准QoE评分和QoE偏移量,得到重建视频流媒体的QoE评分。其从服务质量和视频内容因素两方面考虑,根据QoS特征和语义特征对语义通信过程中产生的重建视频流媒体的体验质量QoE进行综合评估,使得结果更加真实、有效。
-
公开(公告)号:CN116743609A
公开(公告)日:2023-09-12
申请号:CN202311013701.4
申请日:2023-08-14
申请人: 清华大学 , 中移(杭州)信息技术有限公司
IPC分类号: H04L41/5067 , H04L41/5009 , H04N21/44 , H04N21/647
摘要: 本申请提供了一种基于语义通信的视频流媒体的QoE评估方法及装置,首先通过语义通信解码端解码进行视频重建,生成重建视频流媒体。然后通过语义通信解码端获取重建视频流媒体的QoS表征,并确定其对应的基准QoE评分。同时,对重建视频流媒体中各个重建视频帧进行前景语义分析,得到对应的前景语义一致性表征,并比较相邻两个视频帧的前景语义一致性表征,得到QoE偏移量。最后通过语义通信解码端根据基准QoE评分和QoE偏移量,得到重建视频流媒体的QoE评分。其从服务质量和视频内容因素两方面考虑,根据QoS特征和语义特征对语义通信过程中产生的重建视频流媒体的体验质量QoE进行综合评估,使得结果更加真实、有效。
-
-
-
-
-