一种基于特征解耦增强的文本生成视频方法

Invention Grant

Please log in to see more content

Patent Title: 一种基于特征解耦增强的文本生成视频方法
Application No.: CN202411132278.4

Application Date: 2024-08-19
Publication No.: CN118658106B

Publication Date: 2024-11-22
Inventor: 孙玉宝 , 白志远 , 刘青山 , 刘佳
Applicant: 南京信息工程大学
Applicant Address: 江苏省南京市江北新区宁六路219号
Assignee: 南京信息工程大学
Current Assignee: 南京信息工程大学
Current Assignee Address: 江苏省南京市江北新区宁六路219号
Agency: 南京纵横知识产权代理有限公司
Agent 何春廷
Main IPC: G06V20/40
IPC: G06V20/40 ; G06V10/82 ; G06N3/045 ; G06N3/048 ; G06N3/08

Abstract:

本发明公开一种基于特征解耦增强的文本生成视频方法，属于文本生成视频技术领域。其包括，将用户文本输入到预先训练好的文本生成视频网络模型中，得到与所述用户文本描述相符的视频；其中，所述文本生成视频网络模型包括视觉特征解耦网络、跨帧注意力模块及时间注意力模块，所述视觉特征解耦网络用于将视频特征进行解耦分层，所述跨帧注意力模块用于加强解耦分层的视频特征连续三帧的关联，所述时间注意力模块用于加强经过跨帧注意力输出的隐层特征全局帧的关联；本发明适用于文本生成视频，能够有效提升了生成视频细节质量。

Public/Granted literature

CN118658106A 一种基于特征解耦增强的文本生成视频方法 Public/Granted day:2024-09-17

Information query

Chinese Patent Announcement Global Dossier Espacenet

IPC分类:

G	物理
G06	计算；推算或计数
G06V	图像或视频识别或理解
G06V20/00	场景；特定场景元素（控制数码相机 H04N5/232）
G06V20/40	.在视频内容中（提取叠加文本 G06V20/62）（视频检索 G06F16/70）（在视频服务器中处理视频基本流H04N21/234）（在视频客户端中处理视频基本流H04N21/44）