Patent search ap:("北京邮电大学" OR "鹏城实验室") AND inv:"程祥" Page 1

1.

发明公开
一种数据集扩充方法及装置有权

公开(公告)号：CN118607668A

公开(公告)日：2024-09-06

申请号：CN202410830079.4

申请日：2024-06-25

Applicant: 北京邮电大学 , 鹏城实验室

Inventor： 何召锋 , 高骏 , 吴惠甲 , 项刘宇 , 程祥 , 王雯 , 刘方明

IPC: G06N20/00 , G06F18/214 , G06N3/08 , G06N3/0455 , G06F16/35 , G06F40/30

Abstract: 本公开提供了一种数据集扩充方法及装置，属于数据处理技术领域，该方法包括：基于第一语言模型生成第一样本数据；将第一样本数据添加至包含有第二样本数据的数据集中，从数据集中筛选出第三样本数据；第二样本数据为真实数据，第三样本数据为第一样本数据中与真实数据的关联度小于第一阈值的数据；基于第四样本数据训练第一语言模型；第四样本数据为数据集中除第三样本数据之外的数据；返回执行基于第一语言模型生成第一样本数据的步骤，直至满足设定条件，得到扩充后的数据集。本公开提供的一种数据集扩充方法及装置能够淘汰低质量样本，优化生成过程，有效保留更加丰富和高质量的样本。

2.

发明授权
一种数据集扩充方法及装置有权

公开(公告)号：CN118607668B

公开(公告)日：2025-04-18

申请号：CN202410830079.4

申请日：2024-06-25

Applicant: 北京邮电大学 , 鹏城实验室

Inventor： 何召锋 , 高骏 , 吴惠甲 , 项刘宇 , 程祥 , 王雯 , 刘方明

IPC: G06N20/00 , G06F18/214 , G06N3/08 , G06N3/0455 , G06F16/353 , G06F40/30

Abstract: 本公开提供了一种数据集扩充方法及装置，属于数据处理技术领域，该方法包括：基于第一语言模型生成第一样本数据；将第一样本数据添加至包含有第二样本数据的数据集中，从数据集中筛选出第三样本数据；第二样本数据为真实数据，第三样本数据为第一样本数据中与真实数据的关联度小于第一阈值的数据；基于第四样本数据训练第一语言模型；第四样本数据为数据集中除第三样本数据之外的数据；返回执行基于第一语言模型生成第一样本数据的步骤，直至满足设定条件，得到扩充后的数据集。本公开提供的一种数据集扩充方法及装置能够淘汰低质量样本，优化生成过程，有效保留更加丰富和高质量的样本。

3.

发明公开
大语言模型评测方法及装置、电子设备、可读存储介质审中-实审

公开(公告)号：CN118364250A

公开(公告)日：2024-07-19

申请号：CN202410499728.7

申请日：2024-04-24

Applicant: 北京邮电大学

Inventor： 何召锋 , 高骏 , 吴惠甲 , 项刘宇 , 程祥

IPC: G06F18/21 , G06F16/332

Abstract: 本公开提供了一种大语言模型评测方法及装置、电子设备、可读存储介质，属于智能对话技术领域，该方法包括：基于第一问题和多个第一追问问题依次对第一语言模型进行静态测试，得到第一语言模型针对于第一问题和多个第一追问问题的第一回复信息；基于第一问题和多个第二追问问题依次对第一语言模型进行动态测试，得到第一语言模型针对于第一问题和多个第二追问问题的第二回复信息；基于第一回复信息和第二回复信息确定第一语言模型的评测结果。本公开提出的静态测试和动态测试结合的评估方法能够更准确地评估模型的多轮对话能力，从而更好地反映模型在真实世界应用中的表现。

4.

发明授权
一种满足本地差分隐私的轨迹数据收集方法及系统有权

公开(公告)号：CN114091100B

公开(公告)日：2024-05-03

申请号：CN202111391595.4

申请日：2021-11-23

Applicant: 北京邮电大学

Inventor： 程祥 , 苏森 , 杨健宇 , 李悦嘉

IPC: G06F21/62 , G06N7/01

Abstract: 本申请公开了一种满足本地差分隐私的轨迹数据收集方法及系统，本申请实施例提供的方法，首先，将设定的地理区域进行网栅离散化，在地理区域内形成满足本地差分隐私的网栅，以离散用户的轨迹数据；其次，根据形成的网栅，离散化用户的轨迹数据，即将用户的轨迹数据中的每个地理位置替换为该位置所在晶格的索引值；再次，以在网栅中的每个晶格内的用户轨迹数据为样本，学习得到隐马尔科夫模型；最后，从学习得到的隐马尔科夫模型中抽样生成该地理区域的轨迹数据集。由于在用户轨迹数据收集过程中每个用户的轨迹数据都通过最优本地哈希法进行扰动处理，所以解决了用户隐私泄露问题，提供的设定地理区域的轨迹数据集中剔除了用户隐私信息。

5.

发明公开
共享数据确定方法、装置、电子设备及存储介质审中-实审

公开(公告)号：CN115454949A

公开(公告)日：2022-12-09

申请号：CN202210892219.1

申请日：2022-07-27

Applicant: 北京邮电大学

Inventor： 苏森 , 程祥 , 王振亚

IPC: G06F16/176 , G06K9/62 , G06N3/04 , G06N3/08

Abstract: 本申请提供一种共享数据确定方法、装置、电子设备及存储介质。该方法包括：接收当前批次的生成记录数据和敏感记录数据；利用局部判别器网络根据当前批次的生成记录数据和敏感记录数据更新局部判别器网络；利用更新后的局部判别器网络构造局部判别器响应，并利用数据共享平台根据预先获取到的真实集成记录训练数据、合成集成记录训练数据和判别器响应训练关系判别器以更新生成器网络；将预先采集到的随机向量输入至更新后的生成器网络以得到生成记录数据组；生成记录数据组，包括：多个生成记录数据；根据每个生成记录数据的权重构建目标共享数据。实现了能够在保证避免隐私泄露的同时实现垂直分割的数据共享，保证共享数据具有较高的可用性。

6.

发明公开
一种图像数据处理方法和装置审中-实审

公开(公告)号：CN115439708A

公开(公告)日：2022-12-06

申请号：CN202210845137.1

申请日：2022-07-18

Applicant: 北京邮电大学

Inventor： 王玉龙 , 杨恩 , 徐鹏 , 双锴 , 张忠宝 , 程祥 , 苏森

IPC: G06V10/774 , G06V10/82 , G06N3/04 , G06N3/08

Abstract: 本申请一个实施例提供一种图像数据处理方法和装置，该方法包括：获取图像数据集；对于图像数据集中的每一个像素点，计算以每一个像素点为中心的预设领域窗口内的像素值的加权中位数，进而更新为对应的像素点的像素值，响应于达到预设终止条件，终止数据预处理进程，进而更新图像数据集，以得到更新后的图像数据集；响应于第一预测类别与各个第二预测类别不同并且第一置信度与各个第二置信度不同，确定图像数据集为异常图像数据集并输出；或者响应于各个第二预测类别与第一预测类别相同并且第一置信度与各个第二置信度的差异均超过阈值，确定图像数据集为异常图像数据集并输出。极大地减轻对抗样本对模型的安全形成存在的巨大威胁。

7.

发明公开
一种满足本地差分隐私的真值发现方法和电子设备审中-实审

公开(公告)号：CN115329368A

公开(公告)日：2022-11-11

申请号：CN202210787996.X

申请日：2022-07-04

Applicant: 北京邮电大学

Inventor： 程祥 , 苏森 , 张朋飞

IPC: G06F21/62 , G06N5/04 , G06F16/215

Abstract: 本申请提供一种满足本地差分隐私的真值发现方法和电子设备包括：发布多个真值发现任务，并根据所述多个任务生成指示矩阵；根据所述指示矩阵和所述多个任务的阈值范围以及隐私预算确定对所述指示矩阵的采样比例；根据所述采样比例对所述指示矩阵进行两阶段随机采样并生成索引矩阵后将所述索引矩阵发送至多个用户端口；所述多个用户端口对所述索引矩阵内的数据进行加噪处理得到加噪数据；计算所述多个用户端口的权重后根据所述加噪数据和所述权重对未被采样到的数据进行推断统计；根据所述加噪数据和所述推断统计得到的剩余数据值得到每个采样任务的真值。本申请通过两阶段随机采样以及多可客户端口赋予不同的权重，最终得到每个采样任务的真值。

8.

发明公开
虚拟中毒图像数据的后门触发器拟合方法及相关设备审中-实审

公开(公告)号：CN115170855A

公开(公告)日：2022-10-11

申请号：CN202210492940.1

申请日：2022-05-07

Applicant: 北京邮电大学 , 中国人民解放军32802部队

Inventor： 王玉龙 , 王东霞 , 李阳 , 苏森 , 徐鹏 , 双锴 , 程祥 , 张忠宝

IPC: G06V10/764 , G06V10/774 , G06V10/82 , G06N3/08 , G06N3/04 , G06F21/56

Abstract: 本公开提供一种虚拟中毒图像数据的后门触发器拟合方法及相关设备。所述方法包括：根据原始图像数据集，随机生成张量数据；基于协方差自适应调整的进化策略(CMA‑ES)，随机生成原始图像数据集的多个候选坐标位置，并根据原始图像数据集和张量数据构造第一虚拟中毒图像数据集；将原始图像数据集和第一虚拟中毒图像数据集输入到预先训练的注入后门的分类模型中，根据计算得到的激活后门的第一成功率确定目标坐标位置并构造目标虚拟中毒图像数据集；迭代训练张量数据，将训练好的张量数据确定为虚拟中毒图像数据的后门触发器。本公开的方案拟合出的后门触发器没有尺寸大小的限制，检测后门更具通用性，从而提升神经网络模型的安全性。

9.

发明公开
神经网络模型的对抗样本生成方法及相关设备审中-实审

公开(公告)号：CN114677556A

公开(公告)日：2022-06-28

申请号：CN202210204381.X

申请日：2022-03-03

Applicant: 北京邮电大学 , 中国人民解放军32802部队

Inventor： 王玉龙 , 刘俊 , 王东霞 , 苏森 , 徐鹏 , 双锴 , 程祥 , 张忠宝

IPC: G06V10/774 , G06V10/764 , G06K9/62 , G06N3/08

Abstract: 本申请提供一种神经网络模型的对抗样本生成方法及相关设备，所述方法包括：基于生成对抗网络，首先获取与神经网络模型的攻击需求对应的原始数据集；之后对神经网络模型进行预训练，得到预训练模型；根据原始数据集对生成对抗网络的生成器、判别器和预训练模型进行迭代训练，最终得到目标生成器；并通过目标生成器生成对抗样本。该方法不受限于数据集的情况及具体模型，根据不同数据集的情况，可以对指定模型进行生成器的训练，方便地提升了对抗样本的生成效率。

10.

发明公开
满足差分隐私的域自适应方法及相关设备审中-实审

公开(公告)号：CN114357503A

公开(公告)日：2022-04-15

申请号：CN202111402040.5

申请日：2021-11-19

Applicant: 北京邮电大学

Inventor： 程祥 , 金凯忠

IPC: G06F21/62 , G06K9/62

Abstract: 本申请提供了一种满足差分隐私的域自适应方法及相关设备，对目标域的特征空间进行划分，采用差分隐私噪声扰动划分出的目标子空间的协方差矩阵后恢复协方差矩阵的半正定性质。根据划分出的目标子空间对源域的特征空间进行相同的划分得到源子空间，根据源子空间的协方差矩阵和恢复了半正定性质的协方差矩阵计算出映射矩阵，根据映射矩阵对源子空间进行特征变换，采用随机梯度下降方法处理变换后的源子空间得到差分隐私模型。其中划分出多个目标子空间，把高维数据场景转化为多个低维数据场景，避免了噪音协方差矩阵误差上界的增大。恢复噪音协方差矩阵的半正定性质，减轻了差分隐私噪声对域自适应方法性能的破坏。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification