- 专利标题: 具备跨语言学习能力的图像自然语言描述生成方法和装置
- 专利标题(英): Image natural language description generation method and device with cross-linguistic learning ability
-
申请号: CN201710657104.3申请日: 2017-08-03
-
公开(公告)号: CN107480144A公开(公告)日: 2017-12-15
- 发明人: 李锡荣 , 蓝玮毓 , 董建锋
- 申请人: 中国人民大学
- 申请人地址: 北京市海淀区中关村大街59号中国人民大学信息学院
- 专利权人: 中国人民大学
- 当前专利权人: 中国人民大学
- 当前专利权人地址: 北京市海淀区中关村大街59号中国人民大学信息学院
- 代理机构: 北京同立钧成知识产权代理有限公司
- 代理商 杨泽; 刘芳
- 主分类号: G06F17/28
- IPC分类号: G06F17/28 ; G06F17/27 ; G06K9/62
摘要:
本发明提供一种具备跨语言学习能力的图像自然语言描述生成方法和装置,该方法,包括:将英文描述句子通过机器翻译为目标语言描述句子;通过随机采样选取部分目标语言描述句子构成训练样本集;利用通顺样本集和不通顺样本集训练句子通顺度模型;通过句子通顺度模型对候选数据集中的目标语言描述句子进行通顺度评估,根据每个目标语言描述句子的通顺度概率来设置训练图像描述句子生成模型的策略;根据策略训练图像描述句子生成模型,得到训练之后的图像描述句子生成模型。实现依据流畅度评估结果引导训练生成目标语言的图像句子生成模型,降低了不流畅目标语言描述句子对训练过程的影响,提高了目标语言的图像句子生成模型的准确度。
公开/授权文献
- CN107480144B 具备跨语言学习能力的图像自然语言描述生成方法和装置 公开/授权日:2020-10-20