-
公开(公告)号:CN118113884B
公开(公告)日:2024-07-09
申请号:CN202410525610.7
申请日:2024-04-29
申请人: 数据空间研究院
摘要: 本发明公开了一种基于矛盾纠纷数据的知识图谱构建方法,包括S1、采集矛盾纠纷数据;S2、对矛盾纠纷数据进行清洗和预处理。S3、对于清洗和预处理后的矛盾纠纷数据,抽取实体、关系和属性,并将非结构化或半结构化数据转化为结构化的三元组;S4、通过改进孪生网络模型计算实体对的相似性,对不同数据源的相似实体之间进行合并,并处理实体消歧问题;S5、采用改进TransE算法进行实体间的关系推理,挖掘隐藏的人员身份信息;S6、基于矛盾纠纷已知风险信息和矛盾纠纷潜在风险信息合并形成矛盾纠纷画像。本发明全方位分析多元矛盾纠纷事件全貌,为分析矛盾纠纷成因溯源和疏导处置提供依据。
-
公开(公告)号:CN118113884A
公开(公告)日:2024-05-31
申请号:CN202410525610.7
申请日:2024-04-29
申请人: 数据空间研究院
摘要: 本发明公开了一种基于矛盾纠纷数据的知识图谱构建方法,包括S1、采集矛盾纠纷数据;S2、对矛盾纠纷数据进行清洗和预处理。S3、对于清洗和预处理后的矛盾纠纷数据,抽取实体、关系和属性,并将非结构化或半结构化数据转化为结构化的三元组;S4、通过改进孪生网络模型计算实体对的相似性,对不同数据源的相似实体之间进行合并,并处理实体消歧问题;S5、采用改进TransE算法进行实体间的关系推理,挖掘隐藏的人员身份信息;S6、基于矛盾纠纷已知风险信息和矛盾纠纷潜在风险信息合并形成矛盾纠纷画像。本发明全方位分析多元矛盾纠纷事件全貌,为分析矛盾纠纷成因溯源和疏导处置提供依据。
-
公开(公告)号:CN117648980B
公开(公告)日:2024-04-12
申请号:CN202410119013.4
申请日:2024-01-29
申请人: 数据空间研究院
IPC分类号: G06N5/025 , G06F40/211 , G06F40/284 , G06F18/24 , G06N3/042 , G06N3/045 , G06N3/0455 , G06N3/08
摘要: 本发明公布了基于矛盾纠纷数据的新型实体关系联合抽取算法,该算法包括以下步骤:S1,通过BERT模型对句子进行编码,以得到词向量;S2,以句子中的单词作为节点构建依存关系树,并确定依存关系树中每个边的权重;S3,基于DERNN和GAT对步骤S2中的节点进行编码;S4,将步骤S3中关于节点的两种编码表示加权融合,确定实体预测模型的总目标函数,本发明的有益效果是,将实体和关系的抽取任务整合在一个模型中,可以更好地捕捉它们之间的关联;通过对实体跨度的全面建模,尤其是考虑了连续单词,能够准确地捕捉实体在文本中的具体位置和范围;整合了BERT的句子表示、依存树构建、DERNN编码和GAT图注意力网络,从不同角度捕捉了输入文本的信息。
-
公开(公告)号:CN117636099B
公开(公告)日:2024-04-12
申请号:CN202410090308.3
申请日:2024-01-23
申请人: 数据空间研究院
摘要: 本发明公布了一种医学图像和医学报告配对训练模型,该模型采用配准医学图像和医学报告的集合#imgabs0#来实现训练,该综合训练模型的训练步骤如下:S1,图像编码;S2,文本编码;S3,注意力加权图像表示;S4,训练模型函数的建立,本发明可以从医学图像和医学报告中自动学习出有用的特征表示,通过联合学习医学图像和报告数据,模型能够捕获两者之间的复杂关系,提高数据的表征能力和信息提取效果,将现代深度学习技术引入医学领域,从而实现对多模态医学数据的整合分析,为临床诊断和疾病监测提供更精确和全面的支持。
-
公开(公告)号:CN116386799A
公开(公告)日:2023-07-04
申请号:CN202310652088.4
申请日:2023-06-05
申请人: 数据空间研究院
摘要: 本发明属于医疗数据和信息传输技术领域,尤其涉及一种医疗数据采集与标准转换方法及系统。一种医疗数据采集与标准转换方法,包括:S1,在医院侧设立与医疗机构业务库对接的前置机,前置机中包含标准转换单元和前置库;S2,医疗机构业务库采集医疗数据,并将医疗数据传输至标准转换单元;通过数据标准自动转换服务,将医疗数据转换成标准数据,与该过程中产生的新的映射关系与日志一并存储于前置库中;S3,平台侧部署Flink CDC组件,读取前置库中的新增日志数据;S4,平台侧将Flink CDC组件所读取的新增日志数据解析为数据操作指令,在平台侧产生标准数据。本发明可及时采集医疗数据,并将其稳定地转换为数据采集平台所需的标准数据。
-
公开(公告)号:CN118016315A
公开(公告)日:2024-05-10
申请号:CN202410422041.3
申请日:2024-04-09
申请人: 数据空间研究院
IPC分类号: G16H50/70 , G16H50/30 , G06N20/00 , G06N5/01 , G06F18/213
摘要: 本发明公开了一种基于数据分析的胰腺癌预测系统及预测方法,包括数据采集模块:用于收集来自不同数据源的数据;数据预处理模块:对数据采集模块收集到的数据进行清洗、去噪和预处理;特征提取模块:对预处理后的数据提取与胰腺癌风险相关的特征;机器学习模型构建模块:选择机器学习模型,并基于已标注的训练数据对机器学习模型进行训练和优化,并进行特征选择和机器学习模型参数调整;个体化预测模块:对于待评估的个体,根据个体的各项健康数据和医疗历史数据输入机器学习模型进行计算,得出对应的风险等级或概率预测。本发明通过充分整合多源数据以及采用先进的机器学习和数据挖掘算法,优化了胰腺癌预测模型,提高预测准确性。
-
公开(公告)号:CN117648980A
公开(公告)日:2024-03-05
申请号:CN202410119013.4
申请日:2024-01-29
申请人: 数据空间研究院
IPC分类号: G06N5/025 , G06F40/211 , G06F40/284 , G06F18/24 , G06N3/042 , G06N3/045 , G06N3/0455 , G06N3/08
摘要: 本发明公布了基于矛盾纠纷数据的新型实体关系联合抽取算法,该算法包括以下步骤:S1,通过BERT模型对句子进行编码,以得到词向量;S2,以句子中的单词作为节点构建依存关系树,并确定依存关系树中每个边的权重;S3,基于DERNN和GAT对步骤S2中的节点进行编码;S4,将步骤S3中关于节点的两种编码表示加权融合,确定实体预测模型的总目标函数,本发明的有益效果是,将实体和关系的抽取任务整合在一个模型中,可以更好地捕捉它们之间的关联;通过对实体跨度的全面建模,尤其是考虑了连续单词,能够准确地捕捉实体在文本中的具体位置和范围;整合了BERT的句子表示、依存树构建、DERNN编码和GAT图注意力网络,从不同角度捕捉了输入文本的信息。
-
公开(公告)号:CN118116600B
公开(公告)日:2024-07-09
申请号:CN202410532738.6
申请日:2024-04-30
申请人: 数据空间研究院
IPC分类号: G16H50/30 , G16H10/20 , G16H10/40 , G16H10/60 , G16B20/10 , G16B20/20 , G16B25/10 , G16B40/00 , G06N3/042 , G06N3/045 , G06N3/0442 , G06N3/084 , G06N3/0985
摘要: 本发明公开了一种基于多组学和临床检验数据的结直肠癌预后方法,包括S1、从不同数据源、数据库或实验收集来自不同结直肠癌患者组学数据和患者在手术切除结直肠癌后两年后的生存状况,并采集与患者相关的临床数据,并对组学数据和临床数据进行预处理操作;S2、通过预处理后的组学数据和临床数据以及生存状况构建患者组学相似性网络;S3、编码患者的节点拓扑结构信息和患者临床数据信息;S4、将患者的节点拓扑结构信息和患者临床数据信息添加到图注意力网络的编码中;S5、通过预测模型预测患者在手术切除结直肠癌后两年后的生存状况;S6、使用二元交叉熵损失函数对预测模型进行优化。本发明具备更好的动态适应性,适应癌症发展中的动态变化。
-
公开(公告)号:CN118016315B
公开(公告)日:2024-06-25
申请号:CN202410422041.3
申请日:2024-04-09
申请人: 数据空间研究院
IPC分类号: G16H50/70 , G16H50/30 , G06N20/00 , G06N5/01 , G06F18/213
摘要: 本发明公开了一种基于数据分析的胰腺癌预测系统及预测方法,包括数据采集模块:用于收集来自不同数据源的数据;数据预处理模块:对数据采集模块收集到的数据进行清洗、去噪和预处理;特征提取模块:对预处理后的数据提取与胰腺癌风险相关的特征;机器学习模型构建模块:选择机器学习模型,并基于已标注的训练数据对机器学习模型进行训练和优化,并进行特征选择和机器学习模型参数调整;个体化预测模块:对于待评估的个体,根据个体的各项健康数据和医疗历史数据输入机器学习模型进行计算,得出对应的风险等级或概率预测。本发明通过充分整合多源数据以及采用先进的机器学习和数据挖掘算法,优化了胰腺癌预测模型,提高预测准确性。
-
公开(公告)号:CN117636099A
公开(公告)日:2024-03-01
申请号:CN202410090308.3
申请日:2024-01-23
申请人: 数据空间研究院
摘要: 本发明公布了一种医学图像和医学报告配对训练模型,该模型采用配准医学图像和医学报告的集合 来实现训练,该综合训练模型的训练步骤如下:S1,图像编码;S2,文本编码;S3,注意力加权图像表示;S4,训练模型函数的建立,本发明可以从医学图像和医学报告中自动学习出有用的特征表示,通过联合学习医学图像和报告数据,模型能够捕获两者之间的复杂关系,提高数据的表征能力和信息提取效果,将现代深度学习技术引入医学领域,从而实现对多模态医学数据的整合分析,为临床诊断和疾病监测提供更精确和全面的支持。
-
-
-
-
-
-
-
-
-