发明公开
- 专利标题: 图像描述文本确定方法、装置、电子设备及存储介质
-
申请号: CN202410071303.6申请日: 2024-01-17
-
公开(公告)号: CN117854071A公开(公告)日: 2024-04-09
- 发明人: 王晨曦 , 宁瑞华
- 申请人: 天翼电信终端有限公司
- 申请人地址: 北京市丰台区凤凰嘴街1号院1号楼中国通信服务大厦
- 专利权人: 天翼电信终端有限公司
- 当前专利权人: 天翼电信终端有限公司
- 当前专利权人地址: 北京市丰台区凤凰嘴街1号院1号楼中国通信服务大厦
- 代理机构: 北京康信知识产权代理有限责任公司
- 代理商 张文华
- 主分类号: G06V20/70
- IPC分类号: G06V20/70 ; G06V10/44 ; G06V10/82 ; G06N3/0464 ; G06N3/0455 ; G06N3/0442 ; G06N3/084 ; G06N3/092 ; G06N3/048
摘要:
本申请公开了一种图像描述文本确定方法、装置、电子设备及存储介质。其中,该方法包括:采用目标模型的目标编码器,提取目标图像的目标图像特征;采用目标模型的目标解码器,依据目标图像特征,逐个生成描述单词,其中,每个描述单词是由目标解码器依据目标图像特征、以及已生成的全部描述单词所确定的;在目标解码器生成的下一个描述单词为结束标识的情况下,确定已生成的描述单词为目标图像描述文本序列,其中,目标图像描述文本序列用于描述目标图像的图像内容。本申请解决了由于相关技术中的图像描述方法,在当前时刻描述文本生成时,仅参考前一时刻的一个单词,造成的图像描述准确性差的技术问题。