一种生成式多模态互利增强视频语义通信方法

发明授权

请登陆查看更多内容

专利标题： 一种生成式多模态互利增强视频语义通信方法
申请号： CN202310687966.6

申请日： 2023-06-12
公开(公告)号： CN116939320B

公开(公告)日： 2024-06-18
发明人: 吴伟 , 陈元乐 , 刘纯玉 , 熊师洵 , 周福辉 , 吴启晖
申请人： 南京邮电大学
申请人地址： 江苏省南京市栖霞区文苑路9号
专利权人： 南京邮电大学
当前专利权人： 南京邮电大学
当前专利权人地址： 江苏省南京市栖霞区文苑路9号
代理机构： 南京锐恒专利代理事务所
代理商 陈思
主分类号： H04N21/80
IPC分类号： H04N21/80 ; H04N21/233 ; H04N21/234 ; H04N21/2343 ; H04N21/2383 ; H04N21/439 ; H04N21/44 ; H04N21/4402 ; H04N21/438 ; G06F18/25 ; G06N3/048 ; G06N3/0475 ; G06N3/0499 ; G06N3/0464 ; G06N3/0455 ; G06N3/09

摘要：

本发明公开了一种生成式多模态互利增强视频语义通信方法，称为MME‑SC。该方法建立在条件生成对抗网络(CGAN)的基础上，旨在使用文本作为主要传输载体，利用不同模态之间的互利增强来实现目标语义信息的精准提取，从而完成视频传输任务。在多模态互利增强网络的帮助下，我们从视频的关键帧图像和音频中提取语义信息，并进行差值处理，以确保提取的文本以更少的比特传达准确的语义信息，从而提高系统的容量。此外，本发明设计了一个多帧语义检测模块，以督促视频生成过程中的语义过渡。仿真结果表明，本发明出的框架在复杂噪声环境中对视频的传输具有较高的鲁棒性，特别是在低信噪比条件下，显著提高了视频通信中语义传输的准确性和符号传输速率。

公开/授权文献

CN116939320A 一种生成式多模态互利增强视频语义通信方法公开/授权日：2023-10-24

信息查询

中国专利公布公告 Global Dossier Espacenet

IPC分类:

H	电学
H04	电通信技术
H04N	图像通信，如电视
H04N21/00	可选的内容分发，例如交互式电视,或视频点播[VOD]（运动视频数据的实时双向传输入H04N7/14）
H04N21/80	.通过内容产生器独立于分配过程实现的内容或附加数据的生成或处理；内容本身