Invention Grant
- Patent Title: 一种基于特征解耦增强的文本生成视频方法
-
Application No.: CN202411132278.4Application Date: 2024-08-19
-
Publication No.: CN118658106BPublication Date: 2024-11-22
- Inventor: 孙玉宝 , 白志远 , 刘青山 , 刘佳
- Applicant: 南京信息工程大学
- Applicant Address: 江苏省南京市江北新区宁六路219号
- Assignee: 南京信息工程大学
- Current Assignee: 南京信息工程大学
- Current Assignee Address: 江苏省南京市江北新区宁六路219号
- Agency: 南京纵横知识产权代理有限公司
- Agent 何春廷
- Main IPC: G06V20/40
- IPC: G06V20/40 ; G06V10/82 ; G06N3/045 ; G06N3/048 ; G06N3/08

Abstract:
本发明公开一种基于特征解耦增强的文本生成视频方法,属于文本生成视频技术领域。其包括,将用户文本输入到预先训练好的文本生成视频网络模型中,得到与所述用户文本描述相符的视频;其中,所述文本生成视频网络模型包括视觉特征解耦网络、跨帧注意力模块及时间注意力模块,所述视觉特征解耦网络用于将视频特征进行解耦分层,所述跨帧注意力模块用于加强解耦分层的视频特征连续三帧的关联,所述时间注意力模块用于加强经过跨帧注意力输出的隐层特征全局帧的关联;本发明适用于文本生成视频,能够有效提升了生成视频细节质量。
Public/Granted literature
- CN118658106A 一种基于特征解耦增强的文本生成视频方法 Public/Granted day:2024-09-17
Information query