一种prompt自动生成方法、系统、终端及介质

    公开(公告)号:CN118485127A

    公开(公告)日:2024-08-13

    申请号:CN202410508181.2

    申请日:2024-04-25

    IPC分类号: G06N3/084 G06N5/04

    摘要: 本发明涉及自然语言处理领域,具体公开一种prompt自动生成方法、系统、终端及介质,收集若干prompt作为初始样本;对初始样本进行预处理,获得训练集;使用训练集对选定的开源大型语言模型进行微调训练;使用训练好的开源大型语言模型生成prompt。本发明通过机器学习方法微调训练开源大型语言模型,使用训练好的开源大型语言模型生成prompt,实现prompt的自动生成,且可涵盖多种形式的prompt,构建准确率较高。

    一种大语言模型的训练方法、系统、装置及可读存储介质

    公开(公告)号:CN117874794B

    公开(公告)日:2024-07-05

    申请号:CN202410276300.6

    申请日:2024-03-12

    IPC分类号: G06F21/60 G06F21/62 G06F9/50

    摘要: 本发明提出的一种大语言模型的训练方法、系统、装置及可读存储介质,属于人工智能技术领域。所述方法包括:提取域内数据,对数据进行加密操作,并将加密后的域内数据发送至计算节点;对大语言模型的预设层级结构进行加密,得到加密的模型数据,并发送至计算节点;利用加密后的域内数据和加密的模型数据按照模型前向传播的计算过程进行复现模型在密文情况下的前向传播;将计算得到的模型前向传播的密文输出结果进行解密,在模型的剩余层级上的继续进行模型训练;实时获取模型训练过程中反向梯度回传的数据,利用隐私计算技术对数据进行加密后回传至计算节点进行模型的复验训练。本发明保证了数据安全,降低了运算资源的要求和模型训练的成本。

    一种评估标注质量的方法及系统

    公开(公告)号:CN118070028A

    公开(公告)日:2024-05-24

    申请号:CN202410458895.7

    申请日:2024-04-17

    摘要: 本发明涉及一种评估标注质量的方法及系统,属于标注语料库技术领域,所述方法包括:从待评估标注语料库中获取样本数据,得到待评估样本数据;基于统一的标注规范,对待评估样本数据的标注前的原始数据进行标注,得到对比样本数据;计算待评估样本数据与对比样本数据的一致性值;根据一致性值评估待评估标注语料库的标注质量。该方法通过统一的标注规范,得到待评估样本数据和对比样本数据,并判断待评估样本数据与对比样本数据一致性值,进而评估待评估样本数据标注质量。

    图像识别方法及系统
    4.
    发明公开

    公开(公告)号:CN116091891A

    公开(公告)日:2023-05-09

    申请号:CN202310009782.4

    申请日:2023-01-04

    摘要: 本发明提供一种图像识别方法及系统,方法包括:根据目标图像与公共数据集中的各图像之间的相似度,确定各图像中与所述目标图像相似的第一图像,所述目标图像是基于联邦学习对原始图像进行处理后得到的;将所述第一图像输入至目标GAN,输出对所述第一图像的识别结果,目标GAN是基于所述公共数据集对GAN进行训练后得到的。所述系统执行所述方法。本发明基于训练好的目标GAN输出对利用联邦学习对原始图像处理后的目标图像相似的第一图像的识别结果,基于该识别结果与原始图像进行比较,能够实现对原始图像的还原度检测,相较于现有技术采用神经网络向量、协同机制等方法进行联邦学习的图像还原度检测,实现简单,准确率高。

    多模态数据汇聚方法、装置和电子设备

    公开(公告)号:CN115328946A

    公开(公告)日:2022-11-11

    申请号:CN202211251044.2

    申请日:2022-10-13

    摘要: 本发明提供一种多模态数据汇聚方法、装置和电子设备,涉及大数据技术领域,所述方法包括:接收至少一个汇聚节点发送的数据更新消息,所述数据更新消息包括各汇聚节点对应的数据源类型;基于所述数据源类型,确定各汇聚节点所需的数据标准;将所述数据标准发送至对应的所述汇聚节点,所述数据标准用于指示所述汇聚节点基于所述数据标准进行数据格式转换;接收各所述汇聚节点发送的经数据格式转换后的封装数据,并将所述封装数据进行融合。本发明可实现各节点数据以统一标准进行有效汇聚,提高汇聚效率并降低管理难度。

    目标分割模型的训练、病灶分割方法及装置

    公开(公告)号:CN115131361A

    公开(公告)日:2022-09-30

    申请号:CN202211068494.8

    申请日:2022-09-02

    摘要: 本发明提供一种目标分割模型的训练、病灶分割方法及装置,涉及人工智能技术领域,目标分割模型的训练方法包括:基于样本特征向量群,利用自监督对比学习对初始模型进行预训练,获得预训练自监督模型;基于样本图像以及样本图像的目标分割结果,对预训练自监督模型进行有监督训练,获得训练好的目标分割模型,以供对输入图像进行目标分割;样本特征向量群基于样本图像获得。本发明提供的目标分割模型的训练、病灶分割方法及装置,能基于少量样本图像,获得数据量较大、像素级的样本特征向量群,能通过像素级的自监督对比学习以及有监督训练,在不降低目标分割模型的分割准确率的基础上,提高目标分割模型的训练效率。

    评估量表生成方法、系统、终端及存储介质

    公开(公告)号:CN118734023A

    公开(公告)日:2024-10-01

    申请号:CN202411231369.3

    申请日:2024-09-04

    IPC分类号: G06F18/21 G06F18/2415

    摘要: 本发明涉及数据处理技术领域,具体提供一种评估量表生成方法、系统、终端及存储介质,包括:创建量表,在所述量表中添加题项,并为所述题项生成类型标识;为类型标识设置对应的计分规则和权重,所述计分规则用于生成具有相应类型标识的所有题项的分值;基于类型标识对应的权重,构建评估函数,所述评估函数基于各类型标识对应的分值计算评估分值;设置评估阈值,基于所述评估阈值确认所述评估分值对应的评估结果。本发明提升了评估量表的处理效率和评估水平。

    肺癌患者静脉血栓栓塞风险预测系统、方法、终端及介质

    公开(公告)号:CN118366662A

    公开(公告)日:2024-07-19

    申请号:CN202410790040.4

    申请日:2024-06-19

    IPC分类号: G16H50/30

    摘要: 本发明涉及患者病情风险预测领域,具体涉及一种肺癌患者静脉血栓栓塞风险预测系统、方法、终端及介质,收集肺癌患者的风险预测数据;对风险预测数据进行预处理;使用逻辑回归方法构建包含所有预测变量的逻辑回归全模型;通过逐个添加或删除变量的方式迭代逻辑回归全模型,计算每次迭代的AIC值,筛选出目标预测变量,获得由目标预测变量构建的逻辑回归预测模型;使用目标预测变量对应的风险预测数据构建样本,对逻辑回归预测模型进行训练;使用训练后的逻辑回归预测模型对目标患者的静脉血栓栓塞风险进行预测。本发明提高对肺癌患者VTE风险预测的准确性和效率。

    一种值域代码标准化转换系统及方法

    公开(公告)号:CN117995332B

    公开(公告)日:2024-07-05

    申请号:CN202410405538.4

    申请日:2024-04-07

    IPC分类号: G16H10/00 G06F40/151

    摘要: 本发明提供一种值域代码标准化转换系统及方法,属于数据治理技术领域,其二者均能够:创建值码转换项目;拆分创建的值码转换项目的待转码数据得到若干个待转码数据,并为拆分出的每一个待转码数据发起转换任务;为发起的每一个转换任务生成带有转码推荐和转码推荐依据的转码任务并添加至任务池;允许转码人员通过任务池查看与领取转码任务,允许转码人员通过其我的任务查看其转码任务及任务状态;允许转码人员点击其我的任务中已完成的转码任务查看对应任务的转码对照表,允许转码人员点击其我的任务中未完成的转码任务,调出对应转码任务的转码界面进行人工转码。本发明有助于实现值码标准化统一,有助于提高人工转码的准确率和效率。

    病历章节重配置方法、系统、终端及存储介质

    公开(公告)号:CN117688927B

    公开(公告)日:2024-04-30

    申请号:CN202410145758.8

    申请日:2024-02-02

    摘要: 本发明属于数据处理技术领域,具体提供一种病历章节重配置方法、系统、终端及存储介质,包括:对电子病历进行文字识别,并将文字识别内容按照段落进行分割,得到多个段落;利用关键词提取技术从段落中提取关键词,并基于关键词在段落中的位置为关键词生成权重;计算段落的关键词与预设的多个章节的关键词组的加权相似度;筛选出相似度最高的章节作为段落所属章节,并将所属章节相同的相邻段落组合为同一章节的章节内容;基于需要配置的章节和章节顺序,调取相应章节内容并将相应章节内容按照所述章节顺序排列,得到重配置病历。本发明实现了病历的整合和有效分析,能够满足多种查询需求。