-
公开(公告)号:CN115170884A
公开(公告)日:2022-10-11
申请号:CN202210861047.1
申请日:2022-07-22
申请人: 西安交通大学 , 上海交通大学医学院附属上海儿童医学中心
摘要: 一种基于分层注意力机制的儿童白血病多实例分类方法,首先,进行细胞分割任务:将儿童白血病病人的多张骨髓细胞图像中的有核细胞通过细胞分割模块提取出来,N个细胞为一份的随机采样,形成一个多实例包,作为样本输入学习;其次,进行儿童白血病分类任务:将上述输入学习后的样本作为儿童白血病分类模块,区分每个样本属于急性髓系白血病,或急性淋巴系白血病,并进一步进行多个层级的分型;本发明使用多示例学习的方法,将细胞编码成特征,并通过注意力模块计算不同细胞对各个类别的贡献度,分型形成层级特征,从细分型的注意力矩阵聚合至粗分型,针对癌细胞比例的损失函数,通过对比例的限制,半监督地分类了各个细胞是否属于癌细胞,使得注意力机制可以更好地计算细胞对各个类别的贡献度,使得分类更为精准。
-
公开(公告)号:CN117725917A
公开(公告)日:2024-03-19
申请号:CN202311844710.8
申请日:2023-12-29
申请人: 西安交通大学
IPC分类号: G06F40/279 , G06F16/36 , G06F40/12 , G06F18/214 , G06F18/2413 , G06N3/0895
摘要: 一种基于交互一致性训练的半监督关系抽取方法、系统、设备及介质,其方法为,首先通过词向量、位置向量以及句子向量进行句子特征提取,能够提取出丰富的语义信息;然后充分利用无标签样本中的信息,将两个模型的差异性转为交互一致性训练损失函数,促进模型的预测一致性,从而提升模型的预测准确率;最后通过不确定性来评估伪标签的质量,避免错误的伪标签所带来的噪声,对模型的训练过程进行指导,完成关系抽取;其系统、设备及介质能够基于上述方法实现交互一致性训练对半监督关系进行抽取;本发明缓解了人工标注所带来的负担,提高模型的泛化能力,有效提升了模型的预测准确率,具有操作高效、精确度高的优点。
-
公开(公告)号:CN110532398B
公开(公告)日:2023-03-31
申请号:CN201910672928.7
申请日:2019-07-24
申请人: 西安交通大学
IPC分类号: G06F16/36 , G06N3/0464 , G06N3/048 , G06N3/084
摘要: 基于多任务联合神经网络模型的家族图谱自动构建方法,首先建立多任务联合神经网络模型;然后训练端到端的联合神经网络模型;再优化端到端的联合神经网络模型,得到最终模型;最后通过最终模型构建家族图谱。本发明的多任务联合模型避免了在所有实体间两两配对进行关系分类,模型输出的冗余性大大降低。本发明提出的联合提取方法也能应用于其他的数据领域上,能在信息提取任务上体现出很好的时间效率和准确性。本发明从效率、精度两方面改善实体抽取及关系分类任务的表现,能灵活的扩展到构建家族图谱任务外的其他需要抽取实体,并进行关系分类的任务中去。
-
公开(公告)号:CN114240958A
公开(公告)日:2022-03-25
申请号:CN202111594975.8
申请日:2021-12-23
申请人: 西安交通大学
摘要: 一种应用于病理学组织分割的对比学习方法,包括进行图像级对比学习任务;进行超像素级对比学习任务;进行像素级对比学习任务;三个层次的对比学习步骤,为病理学组织分割学习提供具有空间敏感性和平滑度的稳健密集表示,使得模型来学习病理组织分割图像从全局到局部对比的判别性表示,进而模型能够清晰地学习到细胞和细胞外基质的特征,有效提升了组织分割的精度。作为医学辅助工具,能显著提高病理学家的判别质量和工作效率。
-
公开(公告)号:CN109543183B
公开(公告)日:2021-01-19
申请号:CN201811367895.7
申请日:2018-11-16
申请人: 西安交通大学
IPC分类号: G06F40/211 , G06F40/295 , G06N3/04
摘要: 本发明提供基于深度神经网络和标注策略的多标签实体‑关系联合提取方法,基于标注策略的联合提取方法,可以有效的避免在命名实体识别子任务中产生的错误会传播至关系分类子任务中和忽视了两个子任务间相互作用的弊端。同时,本发明使用Tree‑GRU作为编码层,可以使模型更加充分的学习到整个句子的依存句法信息,为准确识别两个实体间是否存在关系及存在关系的类型带来帮助。此外,由于海量文本本身具有的复杂性,一个实体可能包含在多种关系中,多标签分类器的使用,很好地解决了上述问题。本发明的方法在不同的数据领域上都取得了较好的结果,能高效准确智能地从海量文本数据中提取有实用价值以及研究意义的信息。
-
公开(公告)号:CN109949907A
公开(公告)日:2019-06-28
申请号:CN201910252955.9
申请日:2019-03-29
申请人: 西安交通大学
摘要: 本发明基于云端的大型病理学图像协作注释方法及系统,首先通过图像预处理模块,在云端通过超像素分割,对病理图片进行预先处理,同时以二值图像进行存储其边际;通过数据记录模块,进行多用户的数据记录,使用户可以协同标注图像;通过前端交互模块,完成对用户动作的捕获,以及病理图片的展示,通过后端处理模块,响应前端交互模块发来的请求,完成数据的标注以及对用户的可能标注区域的提示。通过以上模块所达到的效果,本发明完成在网页端对病理图片进行多人协作、像素级便捷标注的目的。
-
公开(公告)号:CN109543183A
公开(公告)日:2019-03-29
申请号:CN201811367895.7
申请日:2018-11-16
申请人: 西安交通大学
摘要: 本发明提供基于深度神经网络和标注策略的多标签实体-关系联合提取方法,基于标注策略的联合提取方法,可以有效的避免在命名实体识别子任务中产生的错误会传播至关系分类子任务中和忽视了两个子任务间相互作用的弊端。同时,本发明使用Tree-GRU作为编码层,可以使模型更加充分的学习到整个句子的依存句法信息,为准确识别两个实体间是否存在关系及存在关系的类型带来帮助。此外,由于海量文本本身具有的复杂性,一个实体可能包含在多种关系中,多标签分类器的使用,很好地解决了上述问题。本发明的方法在不同的数据领域上都取得了较好的结果,能高效准确智能地从海量文本数据中提取有实用价值以及研究意义的信息。
-
公开(公告)号:CN113868374B
公开(公告)日:2024-04-12
申请号:CN202111083061.5
申请日:2021-09-15
申请人: 西安交通大学
IPC分类号: G06F16/33 , G06F16/35 , G06N3/045 , G06N3/0464 , G06N3/0442 , G06N3/096
摘要: 一种基于多头注意力机制的图卷积网络生物医学信息提取方法,首先建立基于多头注意力机制的图卷积网络模型;然后对该混合模型进行训练;再对模型进行优化,调整参数,得到最终模型;最后使用最终模型进行生物医学文本中的关系提取以及病理报告的特征提取;本发明在提高关系抽取的性能的能够同时有效降低噪声数据的影响,有效地保留了生物医学文本中长距离信息中有价值的内容;使用迁移学习方法处理不同格式和写作风格的病理报告,具有良好的通用性和可重用性;应用于以癌症病理报告为数据源的信息与关系提取,识别效果好,通用性强,有效提高病理检测效率。
-
公开(公告)号:CN114896419A
公开(公告)日:2022-08-12
申请号:CN202210607760.3
申请日:2022-05-31
申请人: 西安交通大学
摘要: 一种基于语义网技术的组织病理切片语义描述语言的建立及应用方法,其中语义描述语言的建立为:通过建立病理特征描述语言的基本项,包括本体类、对象属性与数据属性,能够表示病理切片中的更大范围的病理特征;在应用上,对组成该表型的的每一个实体、实体的属性、实体之间的关系进行细粒度描述,相较现有工作,能够大大降低表示的歧义性,另外,结合网络本体语言(OWL)自身具备的检索、推理等功能,能够进一步降低计算机传输、理解、分析复杂病理特征的难度;本发明能够对不同癌种的病理切片中出现的多元病理特征进行描述,实现对病理特征更加完整、精确的表示,为实现病理数据语义互操作性提供基础技术支撑。
-
公开(公告)号:CN110910302B
公开(公告)日:2021-08-13
申请号:CN201911206466.6
申请日:2019-11-29
申请人: 西安交通大学
摘要: 本发明提供一种特大图像的存储与读写方法,能够支持对图像任意区域进行任意分辨率的读写操作的同时,提供更优的运行效率,占用更少的计算机资源。通过使用以金字塔结构保存图像数据的方法,使得每次读写只需将与操作区域相关的区块载入内存,而不是传统方法中的整张图像,使得特大图像分析与处理在低端配置的电脑上进行更加简便。并且本方法无需用户将图像再次分割为小块图像进行处理,节省了内存和硬盘空间。此外,本发明使得对于图像的局部修改不再需要重新生成整个图像文件,而是仅仅生成被修改区域,使得单次读写操作时空复杂度均为线性,大大提高了特大图像局部修改的性能。
-
-
-
-
-
-
-
-
-