-
公开(公告)号:CN117218489A
公开(公告)日:2023-12-12
申请号:CN202311174074.2
申请日:2023-09-12
申请人: 北京理工大学
IPC分类号: G06V10/774 , G06T11/00 , G06N3/0475 , G06N3/094 , G06N3/0499 , G06N3/048 , G06N3/0464 , G06N3/045 , G06N3/084
摘要: 本发明公开的一种基于关键框点检测的图像样本生成方法,属于计算机视觉领域。本发明为以高斯随机噪声作为输入,通过关键框点生成网络,预设矩形的目标生成位置和嵌入,使用马氏‑高斯heatmap作为初始掩膜,结合Swin‑Transformer‑SPADE生成器生成控制目标生成位置和大小的掩膜,生成分别生成样本图像的前景和背景并最终生成样本图像。可控生成指能够直接解耦图像中物体坐标信息,将图像分解为物体的位置和外观,通过重新定位和交换关键点重新排列生成图像,带标签生成指能够直接保存关键框位置作为目标位置信息。对少样本数据库中的带标签图像样本进行补充,缓解目标检测网络由于缺乏样本而造成的目标检测模型过拟合问题,提升目标检测准确率。