一种限定采样文本序列生成方法及其系统

    公开(公告)号:CN111027292A

    公开(公告)日:2020-04-17

    申请号:CN201911200838.4

    申请日:2019-11-29

    摘要: 本发明实施例提供的限定采样文本序列生成方法及系统,该方法包括:将初始文本序列输入对抗网络模型,获取预输出文本序列的第一个词;基于词表掩模的方法,利用生成器根据第一个词,从字典数据库中选取第一个词的下一个词,构成预输出文本序列;基于词表掩模的方法,根据预输出文本序列,继续选取预输出文本序列的下一个词,获取新的预输出文本序列,直至总词数达到设定阈值,将其输入至判别器进行判别,并根据分类判别结果计算更新梯度;更新生成器的参数,并再次输入初始文本序列至更新后的生成器中;直至生成器和判别器均收敛后,输出目标文本序列。本实施例提供的方法及系统,通过改进制定文本规则精简了采样空间,改善了生成文本质量。

    一种基于判别联合概率的域适配方法及系统

    公开(公告)号:CN111626376A

    公开(公告)日:2020-09-04

    申请号:CN202010515089.0

    申请日:2020-06-08

    IPC分类号: G06K9/62

    摘要: 本发明实施例提供的基于判别联合概率的域适配方法及系统,包括获取历史流量数据集;根据历史流量数据集,构建带标签的源域数据集和带标签的目标域数据集;根据带标签的源域数据集和带标签的目标域数据集,计算源域和目标域之间的联合概率差异;根据联合概率差异获取最小化联合概率差异;基于最小化联合概率差异,将带标签的源域数据集向带标签的目标域数据集进行域适配。本发明实施例提供的域适配方法及系统,通过直接计算最小化联合概率差异,度量边际分布和条件分布的差异,构造了对实质分布差异有效且鲁棒的特征表示,提高了域的可转移性和类的可识别性。

    一种限定采样文本序列生成方法及其系统

    公开(公告)号:CN111027292B

    公开(公告)日:2021-05-28

    申请号:CN201911200838.4

    申请日:2019-11-29

    摘要: 本发明实施例提供的限定采样文本序列生成方法及系统,该方法包括:将初始文本序列输入对抗网络模型,获取预输出文本序列的第一个词;基于词表掩模的方法,利用生成器根据第一个词,从字典数据库中选取第一个词的下一个词,构成预输出文本序列;基于词表掩模的方法,根据预输出文本序列,继续选取预输出文本序列的下一个词,获取新的预输出文本序列,直至总词数达到设定阈值,将其输入至判别器进行判别,并根据分类判别结果计算更新梯度;更新生成器的参数,并再次输入初始文本序列至更新后的生成器中;直至生成器和判别器均收敛后,输出目标文本序列。本实施例提供的方法及系统,通过改进制定文本规则精简了采样空间,改善了生成文本质量。

    一种文本标签分类方法及系统
    6.
    发明公开

    公开(公告)号:CN111782805A

    公开(公告)日:2020-10-16

    申请号:CN202010549098.1

    申请日:2020-06-16

    摘要: 本发明实施例提供一种文本标签分类方法及系统。该方法包括:获取待分类文本集;将待分类文本集输入至文本标签分类模型,得到文本标签分类模型输出的文本标签分类结果;文本标签分类模型是由文本样本集,基于注意力机制对卷积神经网络模型进行评估,并结合主损失函数与双目标辅助损失函数对卷积神经网络模型进行优化得到的。本发明实施例通过在文本标签分类过程中,使用主损失函数和双目标辅助损失函数进行联合优化,将实体关系类别的类内聚合程度与类间远离程度作为奖励项添加到梯度计算中,使得实体关系类别在度量空间中更加分散,类别内更加紧密,并且实现收敛模型迁移到少样本类别中,在信息不足的情况下更加快速地对少样本类别进行空间划分。