- 专利标题: 一种生成式多模态互利增强视频语义通信方法
-
申请号: CN202310687966.6申请日: 2023-06-12
-
公开(公告)号: CN116939320B公开(公告)日: 2024-06-18
- 发明人: 吴伟 , 陈元乐 , 刘纯玉 , 熊师洵 , 周福辉 , 吴启晖
- 申请人: 南京邮电大学
- 申请人地址: 江苏省南京市栖霞区文苑路9号
- 专利权人: 南京邮电大学
- 当前专利权人: 南京邮电大学
- 当前专利权人地址: 江苏省南京市栖霞区文苑路9号
- 代理机构: 南京锐恒专利代理事务所
- 代理商 陈思
- 主分类号: H04N21/80
- IPC分类号: H04N21/80 ; H04N21/233 ; H04N21/234 ; H04N21/2343 ; H04N21/2383 ; H04N21/439 ; H04N21/44 ; H04N21/4402 ; H04N21/438 ; G06F18/25 ; G06N3/048 ; G06N3/0475 ; G06N3/0499 ; G06N3/0464 ; G06N3/0455 ; G06N3/09
摘要:
本发明公开了一种生成式多模态互利增强视频语义通信方法,称为MME‑SC。该方法建立在条件生成对抗网络(CGAN)的基础上,旨在使用文本作为主要传输载体,利用不同模态之间的互利增强来实现目标语义信息的精准提取,从而完成视频传输任务。在多模态互利增强网络的帮助下,我们从视频的关键帧图像和音频中提取语义信息,并进行差值处理,以确保提取的文本以更少的比特传达准确的语义信息,从而提高系统的容量。此外,本发明设计了一个多帧语义检测模块,以督促视频生成过程中的语义过渡。仿真结果表明,本发明出的框架在复杂噪声环境中对视频的传输具有较高的鲁棒性,特别是在低信噪比条件下,显著提高了视频通信中语义传输的准确性和符号传输速率。
公开/授权文献
- CN116939320A 一种生成式多模态互利增强视频语义通信方法 公开/授权日:2023-10-24