一种对图像描述的结果进行自动评估的方法

    公开(公告)号:CN114912512B

    公开(公告)日:2024-07-23

    申请号:CN202210392208.7

    申请日:2022-04-14

    申请人: 南京大学

    IPC分类号: G06V10/74 G06V10/80 G06N20/00

    摘要: 本发明提供了一种对图像描述的结果进行自动评估的方法,包括:步骤1,分别抽取图像和文本的场景图;步骤2,利用多模态预训练模型CLIP对相关元素进行编码;步骤3,计算得到句子质量评价的最终分数。本发明基于场景图来辅助判断图像和文本之间的一致性,提高了无标注场景下质量评价的可信度;本发明使用CLIP模型对图像、文本、场景图进行编码,不仅确保了语义空间的一致性,大大提高了场景图相似度比较的准确性,还保证了编码能力的可更新性。

    一种预测DockerFile创建容器执行时间的方法

    公开(公告)号:CN116467040A

    公开(公告)日:2023-07-21

    申请号:CN202310234697.8

    申请日:2023-03-13

    申请人: 南京大学

    IPC分类号: G06F9/455 G06F8/41 G06F18/24

    摘要: 本发明提出了一种预测DockerFile创建容器执行时间的方法,包括以下步骤:步骤1,构建DockerFile源代码数据集,其中包含源代码样本;步骤2,将所述数据集中的DockerFile源代码转化为抽象语法树路径;步骤3,构建预测基础镜像模型,使用抽象语法树路径对所述预测基础镜像模型进行预训练;步骤4,通过预训练的预测基础镜像模型提取源代码样本的特征向量,将所述特征向量与其他特征向量拼接,获取最终特征向量;步骤5,将最终特征向量输入机器学习模型即随机森林中,得到待预测目标即DockerFile创建容器执行时间的预测结果。

    一种基于强化学习的智能驾驶决策学习方法

    公开(公告)号:CN116306800A

    公开(公告)日:2023-06-23

    申请号:CN202211454693.2

    申请日:2022-11-21

    申请人: 南京大学

    IPC分类号: G06N3/0464 G06N3/08

    摘要: 本发明提供了一种基于强化学习的智能驾驶决策学习方法,本发明通过gate门的输出,对无关连续参数进行遮蔽,能减少训练的整体误差,整个模型考虑了不同参数之间的交互关系,首先由gate门输出离散参数,然后激活对应的连续参数网络,更加准确的增加了参数的相关程度,传统的探索方法使用随机探索,需要设置专门的探索参数,该模型直接根据门控网络输出的值进行探索,能够很好的兼顾探索和未来收益。本发明能够快速的输出混合参数,模型能够及时响应环境的变化,当模型的参数需要迁移时,只需要针对性的改变部分网络模型参数,无需对整个网络进行重新训练。

    一种自动化音乐描述生成方法
    5.
    发明公开

    公开(公告)号:CN116259289A

    公开(公告)日:2023-06-13

    申请号:CN202310117156.7

    申请日:2023-02-15

    申请人: 南京大学

    摘要: 本发明提出了一种自动化音乐描述生成方法,包括以下步骤:步骤1,收集音乐与文本数据;步骤,2,构建音乐描述生成模型MuTeNet;所述音乐描述生成模型包括音乐与文本编解码器;所述音乐与文本编解码器,包括:音乐编解码器即音乐编码器和音乐解码器以及文本编解码器即文本编码器和文本解码器;步骤3,预训练音乐描述生成模型中的音乐与文本编解码器;步骤4,准备训练数据,输入进预训练好的音乐描述生成模型,进行训练;所述训练数据即音乐与配对的文本描述;步骤5,将音乐输入到训练好的模型中,生成音乐的文本描述,完成自动化音乐描述生成。

    自动判断检索机器翻译数据库时机的方法及存储介质

    公开(公告)号:CN115034240A

    公开(公告)日:2022-09-09

    申请号:CN202210794321.8

    申请日:2022-07-07

    申请人: 南京大学

    摘要: 本发明公开了自动判断检索机器翻译数据库时机的方法,方法包括如下步骤:将数据库中的知识划分为被掌握的知识和没被掌握的知识;根据数据库中局部空间内知识的掌握情况,为不同的知识确定知识边界值;将数据库中知识的知识边界值情况作为训练数据,训练一个轻量的多层感知机网络模型,通过多层感知机网络模型预测隐层表示对应的的知识边界值情况;解码翻译目标领域文本时,使用通用领域翻译模型得到翻译上下文的隐层表示之后,根据知识边界值情况,判断通用领域翻译模型在每个解码步时是否需要检索数据库。本发明避免了通用领域翻译模型在每个解码步时不必要的检索行为,在应用不同语言和领域的数据库时,可以自动判断检索时机。

    机器翻译质量评估方法、装置及存储介质

    公开(公告)号:CN113919372A

    公开(公告)日:2022-01-11

    申请号:CN202010663296.0

    申请日:2020-07-10

    申请人: 南京大学

    IPC分类号: G06F40/51 G06F40/58

    摘要: 本公开涉及计算机技术领域,尤其涉及一种机器翻译质量评估方法、装置及存储介质。所述方法:根据预配置的原始平行语料生成伪平行语料,伪平行语料包括多个伪平行语句对,伪平行语句对包括源单语语句和对应的伪目标单语语句,伪目标单语语句的数据分布与真实的机器翻译译文的数据分布的相似程度大于相似阈值;根据伪平行语料对原始质量评估模型进行训练得到目标质量评估模型。本公开实施例通过计算机设备根据预配置的原始平行语料生成伪平行语料,由于伪目标单语语句的数据分布与真实的机器翻译译文的数据分布的相似程度大于相似阈值,因此根据伪平行语料对原始质量评估模型进行训练之后,得到的目标质量评估模型在翻译质量有较大提升。

    通过建模协同关系提高非自回归神经机器翻译质量的方法

    公开(公告)号:CN113095092A

    公开(公告)日:2021-07-09

    申请号:CN202110416255.6

    申请日:2021-04-19

    申请人: 南京大学

    摘要: 本发明公开了一种通过建模协同关系提高非自回归神经机器翻译质量的方法,将源端表示结合目标语言序列的长度构造非自回归神经机器翻译模型中解码器的输入,然后结合依存语法树、源端表示、解码器输入得到目标语言序列的协同关系矩阵,最后将目标语言序列的协同关系矩阵集成于非自回归神经机器翻译模型中的解码器。本发明通过依存语法树来建模目标序列中词与词之间的协同关系,在兼顾依赖关系的同时使翻译质量获得了显著的提升。

    一种利用多样化文本特征进行文本分类的方法

    公开(公告)号:CN108664633B

    公开(公告)日:2020-12-04

    申请号:CN201810460235.7

    申请日:2018-05-15

    申请人: 南京大学

    IPC分类号: G06F16/35 G06F40/247

    摘要: 本发明公开了一种利用多样化文本特征进行文本分类的方法,包括以下步骤:使用多维度文本表示算法,生成多组不同的文本特征表示,即纵向生成多维度文本特征表示;使用多种不同的文本表示算法,生成多组不同的文本特征表示,即横向生成多维度文本特征表示;将每个样本不同的特征表示向量进行组合,作为样本新的特征向量,进而得到数据集新的特征表示。将本发明对现有的文本表示算法进行了改进,提出了利用更多的维度较低且差异较大的文本表示来挖掘文本不同的内部结构,增强文本表示的能力,可以在极大程度上降低文本特征维度的同时,提升文本分类等任务的效果。