一种数据集扩充方法及装置
    1.
    发明公开

    公开(公告)号:CN118607668A

    公开(公告)日:2024-09-06

    申请号:CN202410830079.4

    申请日:2024-06-25

    摘要: 本公开提供了一种数据集扩充方法及装置,属于数据处理技术领域,该方法包括:基于第一语言模型生成第一样本数据;将第一样本数据添加至包含有第二样本数据的数据集中,从数据集中筛选出第三样本数据;第二样本数据为真实数据,第三样本数据为第一样本数据中与真实数据的关联度小于第一阈值的数据;基于第四样本数据训练第一语言模型;第四样本数据为数据集中除第三样本数据之外的数据;返回执行基于第一语言模型生成第一样本数据的步骤,直至满足设定条件,得到扩充后的数据集。本公开提供的一种数据集扩充方法及装置能够淘汰低质量样本,优化生成过程,有效保留更加丰富和高质量的样本。

    满足本地化差分隐私的真值发现方法及电子设备

    公开(公告)号:CN114357502B

    公开(公告)日:2024-07-02

    申请号:CN202111364079.2

    申请日:2021-11-17

    IPC分类号: G06F21/62

    摘要: 本申请提供一种满足本地化差分隐私的真值发现方法及电子设备,在每一个时间点,客户端使用显著性检验中的单样本t检验方法判断相邻时间点间的原始数据变化是否显著,以决定是否更新真值的投票信息并在扰动后上传给服务器,服务器汇总所有客户端的投票信息决定当前时间点需要重新进行真值发现的任务;客户端本地扰动相应任务的数据并上传给服务器,服务器进行考虑客户端权重和任务真值的时间平滑性的动态真值发现,以更新当前时间点的任务真值。这样,能够在保护每一个时间点的客户端原始数据隐私的同时保证较高的真值发现准确度。

    测评题目动态生成方法及系统、电子设备、可读存储介质

    公开(公告)号:CN117993366B

    公开(公告)日:2024-06-21

    申请号:CN202410381770.9

    申请日:2024-04-01

    摘要: 本公开提供了一种测评题目动态生成方法及系统、电子设备、可读存储介质,属于模型测评领域,该方法包括:基于种子题目和提示生成多个第一测试题目;基于目标模型针对多个第一测试题目的第一回复信息确定多个第一测试题目的难度;若多个第一测试题目的难度不符合预设难度,则对多个第一测试题目进行调整,返回执行基于目标模型针对多个第一测试题目的回复信息确定多个第一测试题目的难度的步骤;若多个第一测试题目的难度符合预设难度,则将多个第一测试题目确定为针对目标模型的测试题目。本公开提供的测评题目动态生成方法及系统、电子设备、可读存储介质,以解决现有评估方法缺乏自适应性的问题。

    真值发现方法、装置、电子设备及存储介质

    公开(公告)号:CN115618401A

    公开(公告)日:2023-01-17

    申请号:CN202210957735.8

    申请日:2022-08-10

    发明人: 苏森 程祥 王振亚

    IPC分类号: G06F21/62 G06F17/18 G06F7/58

    摘要: 本申请提供一种真值发现方法、装置、电子设备及存储介质。所述方法包括:获取数据拥有者的偏置、方差以及当前真值;对所述数据拥有者的偏置进行筛选得到偏置集合;在所述偏置集合中选择一个元素作为目标偏置;根据所述目标偏置确定目标数据拥有者,将除所述目标数据拥有者外的其他数据拥有者的当前真值更新为当前真值与其偏置之差;根据所述方差计算得到权重,将所有所述数据拥有者的权重与当前真值之积相加,得到真值;根据所述真值,更新所述偏置和权重。本申请通过提出的加密算法,在不侵犯数据拥有者隐私的条件下,通过消除特定偏置、提高高质量数据拥有者权重的方式,实现满足隐私保护和公平性的真值发现方法。

    神经网络模型的训练方法及装置
    5.
    发明公开

    公开(公告)号:CN114358278A

    公开(公告)日:2022-04-15

    申请号:CN202111423212.7

    申请日:2021-11-26

    IPC分类号: G06N3/08 G06N3/04 G06F21/57

    摘要: 本公开提供一种神经网络模型的训练方法及装置。所述方法包括:获取与所述神经网络模型的攻击防御需求相应的原始数据集;利用所述原始数据集对所述神经网络模型进行预训练,以得到预训练模型;基于协方差矩阵自适应进化策略CMA‑ES,利用训练数据集对所述预训练模型进行补充训练,以得到目标模型。本公开提供的神经网络模型的训练方法及装置,利用基于协方差矩阵自适应进化策略的神经网络训练算法对神经网络进行补充训练,获得鲁棒神经网络模型,提高神经网络对抗防御的准确性和高效性,确保深度学习相关系统的安全性。

    深度神经网络样本木马的构造方法及电子设备

    公开(公告)号:CN114186604A

    公开(公告)日:2022-03-15

    申请号:CN202111241117.5

    申请日:2021-10-25

    IPC分类号: G06K9/62 G06N3/04 G06N3/08

    摘要: 本公开提供一种深度神经网络样本木马的构造方法及电子设备,所述方法包括:通过注入后门中毒数据,调整深度神经网络结构以及构造后门攻击触发模式模型的方法,分析后门中毒数据、深度神经网络结构、后门攻击触发模式与深度神经网络中毒攻击成功之间的关系特性;基于所述关系特性,针对特定类别或通用类别数据构造深度神经网络样本木马的后门攻击触发模式;构造嵌入隐形后门的第一水印图案,以及构造校准图像几何变换的第二水印图案;基于优化所述后门攻击触发模式的方法构造所述深度神经网络样本木马。本公开提供的深度神经网络样本木马的构造方法构造的样本木马,具有良好的隐形性以及鲁棒性,能够为后续木马检测研究提供支撑。

    基于图数据的集合关键字查询方法

    公开(公告)号:CN105740246B

    公开(公告)日:2019-08-06

    申请号:CN201410746565.4

    申请日:2014-12-08

    IPC分类号: G06F16/29

    摘要: 本发明涉及一种基于图数据的集合关键字查询方法,包括:确定目标图中的节点,节点所能提供的服务,提供服务的评分,节点之间的距离和相应开销;解析查询指令,确定起始节点、n个服务关键字、开销约束和半径约束,确定备选集合;对备选集合进行减少冗余计算;对减少冗余计算后的集合进行剪枝;标记查询到的最优集合进行显示。通过本发明的技术方案,能够根据用户提出的多个参数进行查询,满足用户精准的需要,并且通过过滤处理和减冗余处理,可以极大地提高节点查询的速度,从而更快地为用户反馈结果,并且对于大规模的图数据,可以进行分治处理技术,建立多级的索引结构,进而减小问题求解规模并降低算法求解的时间开销。

    一种面向知识图谱的关系分类方法

    公开(公告)号:CN109284378A

    公开(公告)日:2019-01-29

    申请号:CN201811073423.0

    申请日:2018-09-14

    发明人: 苏森 程祥 贾宁宁

    IPC分类号: G06F16/35 G06F16/36

    摘要: 本申请公开了一种面向知识图谱的关系分类方法,包括:a、接收实体对和该实体对的句子包,并确定所述句子包的初始包表示,将初始包表示作为当前包表示;b、将所述句子包的当前包表示和上一次输出的关系组成向量,作为GRU的输入,由GRU计算得到当前隐状态;根据所述当前隐状态,利用分类器计算在当前已输出关系和当前包表示条件下各未输出关系的概率,并选择所述概率最大的关系作为本次输出的关系;c、返回步骤b,直到输出结束。应用本申请,能够提高关系分类的准确性。

    种子用户确定方法
    9.
    发明公开

    公开(公告)号:CN107291860A

    公开(公告)日:2017-10-24

    申请号:CN201710434504.8

    申请日:2017-06-09

    发明人: 苏森 程祥 李晓

    IPC分类号: G06F17/30 G06Q50/00

    CPC分类号: G06F16/9535 G06Q50/01

    摘要: 本发明提供一种种子用户确定方法,包括:针对每个最小签到区域,获取最小签到区域对应的签到用户和签到用户的偏好话题;获取最小签到区域对应的签到用户的影响用户,以及影响用户对签到用户的影响力值;根据查询区域、多个查询话题和区域从属关系,获取B个子覆盖区域;获取每个子覆盖区域针对查询话题的影响力值最大的第二影响力值;根据获取的B个第二影响力值确定第一影响力阈值;获取最大的第二影响力值对应的影响用户在查询区域的第三影响力值;从历史第三影响力值中确定最大第三影响力值。若最大第三影响力值大于或等于第一影响力阈值,则获取最大第三影响力值对应的影响用户为第一种子用户。本发明提高了确定种子用户的效率。

    网页加载方法和装置
    10.
    发明公开

    公开(公告)号:CN106484883A

    公开(公告)日:2017-03-08

    申请号:CN201610900686.9

    申请日:2016-10-17

    IPC分类号: G06F17/30

    CPC分类号: G06F16/9577 G06F16/958

    摘要: 本发明提供一种网页加载方法和装置。其中,该方法包括:获取待加载网页的设计分辨率和网页内容,网页内容中包含至少两种元素;获取电子设备的显示分辨率与设计分比率的比值;根据比值确定网页内容中各元素的布局和/或网页的显示尺寸。本发明提供的网页加载方法和装置,根据电子设备显示分辨率和网页设计分辨率的比值,确定网页内容中各元素的布局和/或网页的显示尺寸,从而在开发和维护时只针对一个版本的网页,降低了网页开发和维护的成本。