一种基于transformer的假视频检测方法
摘要:
一种基于transformer的假视频检测方法,通过对一个视频连续帧的脸图像利用空间视觉transformer模型提取全局空间特征,避免了传统检测方法仅提取局部特征而导致泛化性能差,由于假视频通常在时间序列上具有不一致性,所以进一步通过时间视觉transformer模型捕获全局时间特征,从而使空间特征与时间特征结合来提高检测的准确性,适用于各种改进生成算法生成的deepfake检测,检测到的deepfake的准确度明显优于其他方法。
公开/授权文献
0/0