-
公开(公告)号:CN118016315A
公开(公告)日:2024-05-10
申请号:CN202410422041.3
申请日:2024-04-09
申请人: 数据空间研究院
IPC分类号: G16H50/70 , G16H50/30 , G06N20/00 , G06N5/01 , G06F18/213
摘要: 本发明公开了一种基于数据分析的胰腺癌预测系统及预测方法,包括数据采集模块:用于收集来自不同数据源的数据;数据预处理模块:对数据采集模块收集到的数据进行清洗、去噪和预处理;特征提取模块:对预处理后的数据提取与胰腺癌风险相关的特征;机器学习模型构建模块:选择机器学习模型,并基于已标注的训练数据对机器学习模型进行训练和优化,并进行特征选择和机器学习模型参数调整;个体化预测模块:对于待评估的个体,根据个体的各项健康数据和医疗历史数据输入机器学习模型进行计算,得出对应的风险等级或概率预测。本发明通过充分整合多源数据以及采用先进的机器学习和数据挖掘算法,优化了胰腺癌预测模型,提高预测准确性。
-
公开(公告)号:CN117649413A
公开(公告)日:2024-03-05
申请号:CN202410122426.8
申请日:2024-01-30
申请人: 数据空间研究院
IPC分类号: G06T7/00 , G06V10/20 , G06V10/40 , G06V10/764 , G06V10/82 , G06V20/70 , G06V40/16 , G16H50/20
摘要: 本发明公布了一种基于中医舌象的肠癌深度学习辅助诊断方法,该方法包括以下步骤:S1,数据预处理,获取舌头图像,并生成舌象的数据集;S2,舌象诊断模型的搭建和训练,采用Resnet50网络搭建舌象诊断模型,进行参数训练;S3,舌象特征提取和诊断,提取舌象特征,并输出舌象诊断分数;S4,结合临床参考指标,将舌象诊断分数和临床参考指标进行特征拼接,构造多元组样本数据;S5,肠癌诊断预测,将多元组样本数据输入线性分类器进行肠癌的诊断预测。本发明解决了舌象数据采集困难,舌头图像多元以及舌象诊断标准难以统一等问题。同时,本申请提出的基于中医舌象的肠癌深度学习诊断模型还结合了临床指标数据,进一步提高了诊断的可靠性。
-
公开(公告)号:CN117648980A
公开(公告)日:2024-03-05
申请号:CN202410119013.4
申请日:2024-01-29
申请人: 数据空间研究院
IPC分类号: G06N5/025 , G06F40/211 , G06F40/284 , G06F18/24 , G06N3/042 , G06N3/045 , G06N3/0455 , G06N3/08
摘要: 本发明公布了基于矛盾纠纷数据的新型实体关系联合抽取算法,该算法包括以下步骤:S1,通过BERT模型对句子进行编码,以得到词向量;S2,以句子中的单词作为节点构建依存关系树,并确定依存关系树中每个边的权重;S3,基于DERNN和GAT对步骤S2中的节点进行编码;S4,将步骤S3中关于节点的两种编码表示加权融合,确定实体预测模型的总目标函数,本发明的有益效果是,将实体和关系的抽取任务整合在一个模型中,可以更好地捕捉它们之间的关联;通过对实体跨度的全面建模,尤其是考虑了连续单词,能够准确地捕捉实体在文本中的具体位置和范围;整合了BERT的句子表示、依存树构建、DERNN编码和GAT图注意力网络,从不同角度捕捉了输入文本的信息。
-
公开(公告)号:CN118116600B
公开(公告)日:2024-07-09
申请号:CN202410532738.6
申请日:2024-04-30
申请人: 数据空间研究院
IPC分类号: G16H50/30 , G16H10/20 , G16H10/40 , G16H10/60 , G16B20/10 , G16B20/20 , G16B25/10 , G16B40/00 , G06N3/042 , G06N3/045 , G06N3/0442 , G06N3/084 , G06N3/0985
摘要: 本发明公开了一种基于多组学和临床检验数据的结直肠癌预后方法,包括S1、从不同数据源、数据库或实验收集来自不同结直肠癌患者组学数据和患者在手术切除结直肠癌后两年后的生存状况,并采集与患者相关的临床数据,并对组学数据和临床数据进行预处理操作;S2、通过预处理后的组学数据和临床数据以及生存状况构建患者组学相似性网络;S3、编码患者的节点拓扑结构信息和患者临床数据信息;S4、将患者的节点拓扑结构信息和患者临床数据信息添加到图注意力网络的编码中;S5、通过预测模型预测患者在手术切除结直肠癌后两年后的生存状况;S6、使用二元交叉熵损失函数对预测模型进行优化。本发明具备更好的动态适应性,适应癌症发展中的动态变化。
-
公开(公告)号:CN118016315B
公开(公告)日:2024-06-25
申请号:CN202410422041.3
申请日:2024-04-09
申请人: 数据空间研究院
IPC分类号: G16H50/70 , G16H50/30 , G06N20/00 , G06N5/01 , G06F18/213
摘要: 本发明公开了一种基于数据分析的胰腺癌预测系统及预测方法,包括数据采集模块:用于收集来自不同数据源的数据;数据预处理模块:对数据采集模块收集到的数据进行清洗、去噪和预处理;特征提取模块:对预处理后的数据提取与胰腺癌风险相关的特征;机器学习模型构建模块:选择机器学习模型,并基于已标注的训练数据对机器学习模型进行训练和优化,并进行特征选择和机器学习模型参数调整;个体化预测模块:对于待评估的个体,根据个体的各项健康数据和医疗历史数据输入机器学习模型进行计算,得出对应的风险等级或概率预测。本发明通过充分整合多源数据以及采用先进的机器学习和数据挖掘算法,优化了胰腺癌预测模型,提高预测准确性。
-
公开(公告)号:CN118035337A
公开(公告)日:2024-05-14
申请号:CN202410062035.1
申请日:2024-01-16
申请人: 数据空间研究院
IPC分类号: G06F16/26 , G06F16/2458 , G06F16/215 , G06F16/23 , G06F16/36 , G06F16/28 , G06N5/04 , G06Q10/0635
摘要: 本发明公布了一种新的风险人员关联纠纷挖掘系统,该系统包括以下步骤:S1,数据汇聚和存储;S2,数据预处理;S3,数据治理;S4,构建关系库;S5,构建知识图谱算法模型;S6,将步骤S3中得到的人员维度以及步骤S5中查询得到的身份信息建立人事关联,并进行研判、预测和预警,本发明的有益效果如下:1、能够挖掘纠纷当事人的身份信息,更新关系库,补充纠纷当事人的关联纠纷,补全底层矛盾纠纷数据。2、基于抽取的子图和关系图进行关系推理,可以更准确地进行关系推理,有助于模型更好地泛化到新的实例或未见过的关系类型。3、在双向宽度优先搜索中引入启发式函数来构建子图,可以节约计算成本。
-
公开(公告)号:CN117636099A
公开(公告)日:2024-03-01
申请号:CN202410090308.3
申请日:2024-01-23
申请人: 数据空间研究院
摘要: 本发明公布了一种医学图像和医学报告配对训练模型,该模型采用配准医学图像和医学报告的集合 来实现训练,该综合训练模型的训练步骤如下:S1,图像编码;S2,文本编码;S3,注意力加权图像表示;S4,训练模型函数的建立,本发明可以从医学图像和医学报告中自动学习出有用的特征表示,通过联合学习医学图像和报告数据,模型能够捕获两者之间的复杂关系,提高数据的表征能力和信息提取效果,将现代深度学习技术引入医学领域,从而实现对多模态医学数据的整合分析,为临床诊断和疾病监测提供更精确和全面的支持。
-
公开(公告)号:CN117497045A
公开(公告)日:2024-02-02
申请号:CN202311482172.2
申请日:2023-11-06
申请人: 数据空间研究院
IPC分类号: G16B20/20 , G06F17/11 , G06F18/213 , G06F18/214 , G06F18/2413 , G06F18/22
摘要: 本发明涉及生物信息学技术领域,尤其是一种基于图对比学习的非编码RNA相互作用预测模型和方法。本发明提出的基于图对比学习的非编码RNA相互作用预测模型的构建方法,沿用对比学习框架,通过改变编码器结构,在不影响原始数据拓扑结构情况下获取数据增强后的两种视图数据,通过两种视图数据的对比学习保证了任一种图增强数据对lncRNA与miRNA相互作用潜在特征的精确表达,从而保证了基于图增强数据预测相互作用概率的精确性。
-
公开(公告)号:CN116741397B
公开(公告)日:2023-11-03
申请号:CN202311022652.0
申请日:2023-08-15
申请人: 数据空间研究院
IPC分类号: G16H50/70 , G06F18/22 , G06F18/23 , G06F18/2413 , G06F18/25
摘要: 本发明涉及医疗数据分析技术领域,公开了基于多组学数据融合的癌症分型方法、系统及存储介质。癌症分型方法首先对患者癌症细胞样本的组学数据进行归一化处理,然后基于高斯核函数构建经过归一化处理的各种组学数据的相似性矩阵,再利用相似网络融合算法对各种组学数据的相似性矩阵进行融合,将各种组学数据的相似性矩阵与整体相似性网络的融合过程转化为一个约束最小化问题的构建,通过约束最小化问题求解出目标矩阵。最后利用聚类算法对目标矩阵进行聚类处理,进而将癌症患者划分为不同的亚型或子群体。该癌症分型方法能提供更准确、可靠的癌症分型结果。
-
公开(公告)号:CN118398004B
公开(公告)日:2024-09-17
申请号:CN202410817603.4
申请日:2024-06-24
申请人: 数据空间研究院
IPC分类号: G10L13/08 , G10L13/027 , G10L25/18 , G10L25/30
摘要: 本发明属于自然语言处理技术领域,尤其涉及一种语音大模型的构建和训练方法、音频输出方法及应用。构建和训练方法包括:将包含预训练需求数据和对应的预训练响应数据的预训练集输入语音大模型的编码模块内,将预训练需求映射成预训练需求向量后形成预训练中间表征集送入语音大模型中的处理模块内;处理模块基于预训练需求向量得到响应结果后与预训练中间表征集一并送入语音大模型的判别模块内;预训练中间表征集进入判别模块中的判别器内,同时判别模块将各响应结果送入判别模块的生成器内生成对应音频信号后进入判别器内;判别器计算各音频信号的真实性得分和语音大模型的损失函数后进行优化。本发明能够高效地训练语音大模型。
-
-
-
-
-
-
-
-
-