变换模型训练方法、装置、设备和存储介质

    公开(公告)号:CN110197279B

    公开(公告)日:2021-01-29

    申请号:CN201910498146.6

    申请日:2019-06-10

    摘要: 本发明实施例提出一种变换模型训练方法、装置、设备和存储介质。该变换模型训练方法包括:获取包括对话数据的预训练样本;利用所述对话数据,生成输入特征和预训练目标;利用所述输入特征、所述预训练目标和预训练损失对初始变换模型进行训练,得到预训练变换模型。本发明实施例利用对话数据训练变换模型,可以提高变换模型在语义表示的预测准确性。并且,利用对话数据对初始变换模型进行训练得到预训练变换模型后,再利用预训练变化模型训练具体应用场景所需的变换模型,能够提高变换模型训练的收敛速度。

    模型的蒸馏方法、装置、电子设备及存储介质

    公开(公告)号:CN111832701A

    公开(公告)日:2020-10-27

    申请号:CN202010516895.X

    申请日:2020-06-09

    IPC分类号: G06N3/04 G06N3/08

    摘要: 本申请公开了模型的蒸馏方法、装置、电子设备及存储介质,涉及深度学习技术领域。具体实现方案为:首先,获取教师模型和学生模型;接着,根据教师模型第一中间全连接层的第一数据处理量和学生模型第二中间全连接层的第二数据处理量,将第二中间全连接层转换为放大全连接层和缩小全连接层,并用放大全连接层和缩小全连接层对第二中间全连接层进行替代以生成训练学生模型;之后,根据教师模型对训练学生模型进行蒸馏训练。该方法通过将第二中间全连接层替换为放大全连接层和缩小全连接层,并根据教师模型对训练学生模型进行蒸馏训练,由此,在训练学生模型的中间层进行蒸馏,不需要引入额外全连接层,没有参数冗余,极大地提高了蒸馏效率和效果。

    用于表示异构图节点的模型生成方法及装置

    公开(公告)号:CN111708922A

    公开(公告)日:2020-09-25

    申请号:CN202010564132.2

    申请日:2020-06-19

    IPC分类号: G06F16/901 G06K9/62

    摘要: 本申请公开了用于表示异构图节点的模型生成方法及装置,涉及自然语言处理、知识图谱、深度学习领域。具体实现方案为:获取训练数据集,其中,训练数据集包括根据不同的元路径对异构图进行采样得到的节点游走路径信息;基于梯度下降算法,将训练数据集作为初始异构图节点表示模型的输入,训练初始异构图节点表示模型,得到异构图节点表示模型。本方案采用多种元路径相结合的方式,可以获取不同元路径的语义信息,解决了基于一种元路径的节点表示方法会丢失异构图的路径信息的问题,增强了针对异构图的节点表示能力。

    近邻语义的挖掘方法、装置、存储介质和终端设备

    公开(公告)号:CN108959551A

    公开(公告)日:2018-12-07

    申请号:CN201810712820.1

    申请日:2018-06-29

    IPC分类号: G06F17/30

    摘要: 本发明提出一种近邻语义的挖掘方法、装置、存储介质和终端设备,其中,所述方法包括:获取待挖掘近邻语义的自然语句;根据变分自编码模型的编码器,对所述自然语句进行编码,获得所述自然语句的隐向量;其中,所述隐向量位于所述编码器产出分布的均值点处;对所述隐向量进行近邻语义搜索,获得与所述隐向量具有近邻语义的近邻隐向量;以及根据变分自编码模型的解码器,对近邻隐向量进行解码,获得与所述自然语句具有近邻语义的语句。采用本发明,可以挖掘出大量语义句法近似的语句。

    基于人工智能的语义相似度获取方法及装置

    公开(公告)号:CN106776782A

    公开(公告)日:2017-05-31

    申请号:CN201611042515.3

    申请日:2016-11-21

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明提出一种基于人工智能的语义相似度获取方法及装置,其中,方法包括:通过在得到query和title的多粒度特征后,获取每个粒度特征的权重,通过该权重可以体现出不同粒度的特征所具有的重要程度,然后在对query和title进行多粒度表示时,加入了每个粒度特征的权重这一因数,从而在计算query和title相似度时,不同粒度特征根据自己的重要性发挥不同的作用,使得相似度计算精度更高,实现对现有语音相似度模型的优化,并且可以使得搜索结果精准,能够更符合用户的需求。

    神经网络模型压缩方法以及装置

    公开(公告)号:CN106485316A

    公开(公告)日:2017-03-08

    申请号:CN201610943049.X

    申请日:2016-10-31

    摘要: 本发明公开了一种神经网络模型压缩方法以及装置。其中方法包括:针对神经网络模型中的每一个神经元层,确定每个神经元层的模型参数集合,其中,模型参数集合包含多个模型参数;对多个模型参数进行第一变换以生成多个中间参数;根据预设的量化步长对多个中间参数进行量化,得到多个量化参数;根据预设的量化位数,从多个量化参数中选取多个采样量化点;根据多个量化参数的值和多个采样量化点,生成多个模型参数的量化值;根据量化值对多个模型参数进行压缩存储。该方法可以更好地保持模型效果,大大减少了神经网络模型的大小,减少了计算资源,特别是减少了内存资源的占用。

    视觉模型训练及图像处理方法、装置、设备和存储介质

    公开(公告)号:CN117953339A

    公开(公告)日:2024-04-30

    申请号:CN202311761191.9

    申请日:2023-12-20

    摘要: 本公开提供了一种视觉模型训练及图像处理方法、装置、设备和存储介质,涉及人工智能技术领域,具体涉及计算机视觉、深度学习、大模型等技术领域。视觉模型训练方法包括:基于图像样本的初始图像块,获取初始对象;对所述初始对象中掩码对象进行掩码处理,以获得目标对象,并确定所述掩码对象的掩码标识信息;基于所述目标对象和视觉模型,获取所述掩码对象对应的重建对象;基于所述初始对象、所述重建对象和所述掩码标识信息,构建损失函数;基于所述损失函数,调整所述视觉模型的模型参数。本公开可以提高视觉模型效果。

    为二分图中的节点分配嵌入向量的方法以及装置

    公开(公告)号:CN111176838B

    公开(公告)日:2023-12-22

    申请号:CN201911310875.0

    申请日:2019-12-18

    IPC分类号: G06F9/50

    摘要: 本申请公开了一种为二分图中的节点分配嵌入向量的方法、装置、电子设备以及计算机可读存储介质,涉及图处理技术领域。本申请在为二分图中的节点分配嵌入向量时的实现方案为:获取待处理二分图;确定所述待处理二分图中的少数类节点以及多数类节点;为各少数类节点分配对应各自的嵌入向量,为各多数类节点分配一个共享的嵌入向量,输出所述待处理二分图的向量分配结果。本申请能够提升嵌入向量的分配效率,降低嵌入向量所占用的内存资源。

    搜索结果排序模型生成方法和装置

    公开(公告)号:CN108121814B

    公开(公告)日:2022-04-22

    申请号:CN201711460165.7

    申请日:2017-12-28

    IPC分类号: G06F16/9535 G06N3/08

    摘要: 本申请实施例公开了搜索结果排序模型生成方法和装置。该方法的一具体实施方式包括:利用稳定性预测模型得到用于生成搜索结果排序模型的神经网络的训练样本的稳定性预测结果,以及基于稳定性预测结果和训练样本的原始标注信息,得到训练样本的标注信息;利用该训练样本和训练样本的标注信息对用于生成搜索结果排序模型的神经网络进行训练,得到搜索结果排序模型。搜索结果排序模型基于利用训练样本和包含稳定性预测结果的标注信息对用于生成搜索结果排序模型的神经网络进行训练而得到,使得搜索结果排序模型在对搜索结果进行排序时,不仅考虑搜索结果的点击情况,还会考虑搜索结果的稳定性,排序结果更加精确。

    建立节点表示模型的方法、装置、设备和计算机存储介质

    公开(公告)号:CN112508115A

    公开(公告)日:2021-03-16

    申请号:CN202011477926.1

    申请日:2020-12-15

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本申请公开了一种建立节点表示模型的方法、装置,涉及深度学习技术领域。本申请在建立节点表示模型时所采用的方案为:获取异构图,所述异构图中包含不同类型的节点、节点之间的边以及各节点的属性特征;根据不同的元路径对所述异构图进行采样,将采样得到的对应于各元路径的游走路径作为训练数据;分别将所述异构图中各节点的属性特征进行拼接,将拼接结果作为各节点的初始化特征;根据所述训练数据与各节点的初始化特征对神经网络模型进行训练,得到节点表示模型。本申请能够提升训练得到的节点表示模型在生成节点表示时的准确性。