微调指令的构造方法、装置、设备及介质

    公开(公告)号:CN118734928A

    公开(公告)日:2024-10-01

    申请号:CN202410629625.8

    申请日:2024-05-21

    Abstract: 本公开涉及一种微调指令的构造方法、装置、设备及介质,该方法包括:将负面文本样本的标签划分为多个级别的目标分类标签;基于目标分类标签,使用预设的大模型对负面文本样本构造初始微调指令数据;在检查待微调的目标模型无法遵循初始微调指令数据的情况下,将初始微调指令数据修改为目标微调指令数据。本公开针对从知识库或网络上中搜索到负面文本样本,先划分目标分类标签,在基于此构造初始微调指令数据,其中,对于模型不能理解指令的问题,本实施例可以检查目标模型是否能遵循初始微调指令数据,并在无法遵循的情况下,将初始微调指令数据修改为目标微调指令数据,由此得到的目标微调指令能够使文本分类任务更好的拟合预训练目标模型的知识,提高了微调指令的可用性。

    社交网络图结构匿名化处理方法及装置

    公开(公告)号:CN116070266A

    公开(公告)日:2023-05-05

    申请号:CN202211731149.8

    申请日:2022-12-30

    Abstract: 本申请提供了一种社交网络图结构匿名化处理方法及装置,属于数据安全技术领域。本申请通过,获取社交网络图结构对应的原始图数据,所述原始图数据中每个节点代表一个用户,任意两个节点间的连线所构成的边代表对应两个用户之间的关系;在所述原始图数据对应的所有的边中确定隐私边,并在所述原始图数据中删除所述隐私边得到预处理图;将所述预处理图输入至预先训练好的匿名图生成模型,以使所述匿名图生成模型输出对应的匿名图;其中,所述匿名图生成模型利用图嵌入技术提取所述预处理图的图嵌入特征,并基于所述图嵌入特征输出对应的匿名图。由此可以有效抵御攻击者结合图嵌入技术进行的推断攻击,提高匿名处理的安全性。

    一种互联网网站相似度分析方法、装置以及可读存储介质

    公开(公告)号:CN113378090B

    公开(公告)日:2022-09-06

    申请号:CN202110445408.X

    申请日:2021-04-23

    Abstract: 本发明公开了一种互联网网站相似度分析方法、装置以及可读存储介质,方法包括:从多个未分类的互联网网站中提取文本特征词;将各个未分类的互联网网站的文本特征词分别输入预先获取到的孪生网络编码工具,得到各个未分类的互联网网站的文本向量序列,其中:所述孪生网络编码工具是从训练好的孪生网络中的输入层至权值共享循环神经网络层进行迁移得到,且所述孪生网络的训练是基于从多个已分类的互联网网站中提取的文本特征词实现;将各个未分类的互联网网站的文本向量序列组成的矩阵进行降维处理得到低维弱相关矩阵;对低维弱相关矩阵进行聚类分析,根据聚类分析结果获取所述多个未分类的互联网网站的相似度情况,从而实现互联网网站相似度分析。

    基于移动轨迹数据的用户识别方法、装置及存储介质

    公开(公告)号:CN113704373A

    公开(公告)日:2021-11-26

    申请号:CN202110955784.3

    申请日:2021-08-19

    Abstract: 本申请提供了一种基于移动轨迹数据的用户识别方法、装置及存储介质,该方法包括:获取任意两条待判别的目标轨迹数据,其中,目标轨迹数据为从目标区域中提取出的路径信息,目标区域为用户访问过的区域;将目标轨迹数据的表征集合输入到目标模型内,判断目标轨迹数据是否来自同一用户,其中,目标模型是由初始判别模型训练得到的,输入初始判别模型的训练参数包括:任意两条初始轨迹数据之间的共现次数、任意两条初始轨迹数据之间的角度余弦值、任意两条初始轨迹数据之间的概率偏差值、任意两条初始轨迹数据之间的相似度数值以及用于指示任意两条初始轨迹数据是否来自同一用户的标注信息。通过本申请,解决了相关技术中存在的用户识别准确率较低,稳定性不高的问题。

Patent Agency Ranking