一种基于特征解耦增强的文本生成视频方法
Abstract:
本发明公开一种基于特征解耦增强的文本生成视频方法,属于文本生成视频技术领域。其包括,将用户文本输入到预先训练好的文本生成视频网络模型中,得到与所述用户文本描述相符的视频;其中,所述文本生成视频网络模型包括视觉特征解耦网络、跨帧注意力模块及时间注意力模块,所述视觉特征解耦网络用于将视频特征进行解耦分层,所述跨帧注意力模块用于加强解耦分层的视频特征连续三帧的关联,所述时间注意力模块用于加强经过跨帧注意力输出的隐层特征全局帧的关联;本发明适用于文本生成视频,能够有效提升了生成视频细节质量。
Public/Granted literature
Patent Agency Ranking
0/0