一种数据集扩充方法及装置

    公开(公告)号:CN118607668A

    公开(公告)日:2024-09-06

    申请号:CN202410830079.4

    申请日:2024-06-25

    Abstract: 本公开提供了一种数据集扩充方法及装置,属于数据处理技术领域,该方法包括:基于第一语言模型生成第一样本数据;将第一样本数据添加至包含有第二样本数据的数据集中,从数据集中筛选出第三样本数据;第二样本数据为真实数据,第三样本数据为第一样本数据中与真实数据的关联度小于第一阈值的数据;基于第四样本数据训练第一语言模型;第四样本数据为数据集中除第三样本数据之外的数据;返回执行基于第一语言模型生成第一样本数据的步骤,直至满足设定条件,得到扩充后的数据集。本公开提供的一种数据集扩充方法及装置能够淘汰低质量样本,优化生成过程,有效保留更加丰富和高质量的样本。

    一种数据集扩充方法及装置

    公开(公告)号:CN118607668B

    公开(公告)日:2025-04-18

    申请号:CN202410830079.4

    申请日:2024-06-25

    Abstract: 本公开提供了一种数据集扩充方法及装置,属于数据处理技术领域,该方法包括:基于第一语言模型生成第一样本数据;将第一样本数据添加至包含有第二样本数据的数据集中,从数据集中筛选出第三样本数据;第二样本数据为真实数据,第三样本数据为第一样本数据中与真实数据的关联度小于第一阈值的数据;基于第四样本数据训练第一语言模型;第四样本数据为数据集中除第三样本数据之外的数据;返回执行基于第一语言模型生成第一样本数据的步骤,直至满足设定条件,得到扩充后的数据集。本公开提供的一种数据集扩充方法及装置能够淘汰低质量样本,优化生成过程,有效保留更加丰富和高质量的样本。

    指令数据集构建方法、装置、电子设备及存储介质

    公开(公告)号:CN118916692A

    公开(公告)日:2024-11-08

    申请号:CN202410697065.X

    申请日:2024-05-30

    Abstract: 本申请实施例提供了一种指令数据集构建方法、装置、电子设备及存储介质,属于自然语言处理技术领域。方法包括:获取样本语料文本,以及样本语料文本所处的多个嵌套的背景层级的层级名称;获取预设的提示模板,将多个层级名称作为关键词,并按照对应的背景层级的顺序依次填充到提示模板中的多个空位中,生成第一提示文本;根据第一提示文本和样本语料文本生成目标提示文本,并将目标提示文本输入预设的大语言模型中,得到与样本语料文本相关的目标问答对;基于目标问答对构建指令数据集。本申请实施例提供的指令数据集构建方法、装置、电子设备及存储介质,可以提高构建的指令数据集的质量。

    基于分布式训练框架的智能决策方法及系统

    公开(公告)号:CN119831048A

    公开(公告)日:2025-04-15

    申请号:CN202411953175.4

    申请日:2024-12-27

    Abstract: 本公开提供了一种基于分布式训练框架的智能决策方法及系统,属于人工智能和分布式计算领域,分布式训练框架包括采样器、学习器和协调服务器。智能决策方法包括:从第一策略集中选择k个策略作为训练策略,确定每个训练策略对应的采样器和学习器。将每个训练策略分别与目标策略作为一组进行对抗采样得到第一采样数据。基于第一采样数据对学习器进行训练得到学习器的网络模型参数,对网络模型参数进行聚合得到全局模型参数。将全局模型参数发送至各个学习器和各个采样器进行迭代训练得到满足预设收敛条件的目标策略集。本公开通过将同步采样与分布式并行计算相结合,使智能决策适用于复杂的军事对抗博弈场景,显著提升了策略多样性的优化效果。

    智能体训练方法及装置、电子设备、存储介质

    公开(公告)号:CN119701377A

    公开(公告)日:2025-03-28

    申请号:CN202411939576.4

    申请日:2024-12-26

    Abstract: 本公开提供了一种智能体训练方法及装置、电子设备、存储介质,属于智能体训练技术领域,该方法包括:确定主智能体的第一策略模型和陪练智能体的第二策略模型,第一策略模型为主智能体历史版本池中的模型,第二策略模型为陪练智能体历史版本池中的模型;基于第一策略模型和第二策略模型的交互数据对第一策略模型进行更新得到第三策略模型,基于第一策略模型和第二策略模型的交互数据对第二策略模型进行更新得到第四策略模型;将第三策略模型加入主智能体历史版本池中,将第四策略模型加入到陪练智能体历史版本池中。本公开提供的智能体训练方法及装置、电子设备、存储介质能够满足在非对称任务中策略多变、环境复杂的实际需求。

    一种基于图神经网络的多模态阅读眼动表征方法

    公开(公告)号:CN119357900A

    公开(公告)日:2025-01-24

    申请号:CN202411507526.9

    申请日:2024-10-28

    Abstract: 本发明公开了一种基于图神经网络的多模态阅读眼动表征方法,属于智能学习领域,该方法包括以下步骤:获取被试眼动数据,对所述被试眼动数据进行预处理得到预处理眼动数据;将所述预处理眼动数据转化为拓扑结构图;对所述拓扑结构图进行迭代与多维注意力处理得到节点特征和多维边特征;基于图注意力网络的多维建模方法对所述节点特征和所述多维边特征进行交互融合得到最终的阅读眼动表征输出。本发明提出了一种结合了门控神经网络和边特征图注意力网络的多模态眼动表征方法,能够有效融合眼动特征和文本刺激信息,实现对眼动追踪数据的高效表征。

    基于多模态生物特征识别的中远距离身份认证方法及装置

    公开(公告)号:CN113920591B

    公开(公告)日:2024-06-14

    申请号:CN202111300576.6

    申请日:2021-11-04

    Abstract: 本发明提供一种基于多模态生物特征识别的中远距离身份认证方法及装置,所述方法首先基于可见光场景相机拍摄场景图片检测用户,进一步通过对场景图片内待认证用户的位置调整双目深度相机、红外虹膜相机和补光灯模组的角度朝向所述待认证用户。基于双目深度相机对待认证用户的距离的检测,根据距离调整红外虹膜相机角度和焦距,根据距离调整补光灯模组的角度和亮度,以拍摄出高清的人脸图像和虹膜图像。基于人脸图像和虹膜图像分别提取人脸特征和虹膜特征并融合后用于身份认证,极大提高了识别准确度。所述装置通过双目深度相机确定待认证用户的距离,基于待认证用户的位置和距离调整红外虹膜相机角度和焦距,能够获得更清晰的人脸图像和虹膜图像。

    地铁人群检测追踪方法及系统
    9.
    发明公开

    公开(公告)号:CN118155241A

    公开(公告)日:2024-06-07

    申请号:CN202410300516.1

    申请日:2024-03-15

    Abstract: 本公开提供了一种地铁人群检测追踪方法及系统,属于目标检测技术领域,该方法包括:基于第一检测器对第一数据集进行检测,得到第一检测结果。第一检测器基于注意力机制和目标深度学习模型训练得到。第一数据集为地铁人群的监测视频数据。对第一检测结果进行筛选,得到目标检测结果。基于第一跟踪器对目标检测结果进行跟踪,得到目标检测结果对应的目标运动轨迹。本公开提供的地铁人群检测追踪方法及系统能够解决样本数据较少导致检测精度较低的问题,提高第一检测器的检测精度,快速确定目标检测结果对应的追踪路线,提高追踪效率。

    一种图像分类方法及装置、电子设备、可读存储介质

    公开(公告)号:CN118097283A

    公开(公告)日:2024-05-28

    申请号:CN202410274125.7

    申请日:2024-03-11

    Abstract: 本公开提供了一种图像分类方法及装置、电子设备、可读存储介质,属于机器学习技术领域,该方法包括:基于第一分类类别对目标分类器的权重进行更新。确定第一训练集中样本类别和第二训练集中样本类别的数量比例,基于数量比例计算目标分类器对应的图像分类模型的损失函数值。第一训练集为第一分类类别对应的训练集,第二训练集属于图像分类模型的历史训练集,为第二分类类别对应的训练集。第二分类类别不同于第一分类类别。基于损失函数值、第一训练集以及第二训练集对图像分类模型的骨干网络进行参数更新直至图像分类模型收敛。基于收敛后的图像分类模型进行图像分类。本公开提供的图像分类方法能够减轻数据不平衡问题对图像分类模型训练性能的影响,提高模型的泛化能力。

Patent Agency Ranking