一种基于交互一致性训练的半监督关系抽取方法、系统、设备及介质

    公开(公告)号:CN117725917A

    公开(公告)日:2024-03-19

    申请号:CN202311844710.8

    申请日:2023-12-29

    摘要: 一种基于交互一致性训练的半监督关系抽取方法、系统、设备及介质,其方法为,首先通过词向量、位置向量以及句子向量进行句子特征提取,能够提取出丰富的语义信息;然后充分利用无标签样本中的信息,将两个模型的差异性转为交互一致性训练损失函数,促进模型的预测一致性,从而提升模型的预测准确率;最后通过不确定性来评估伪标签的质量,避免错误的伪标签所带来的噪声,对模型的训练过程进行指导,完成关系抽取;其系统、设备及介质能够基于上述方法实现交互一致性训练对半监督关系进行抽取;本发明缓解了人工标注所带来的负担,提高模型的泛化能力,有效提升了模型的预测准确率,具有操作高效、精确度高的优点。

    基于多任务联合神经网络模型的家族图谱自动构建方法

    公开(公告)号:CN110532398B

    公开(公告)日:2023-03-31

    申请号:CN201910672928.7

    申请日:2019-07-24

    摘要: 基于多任务联合神经网络模型的家族图谱自动构建方法,首先建立多任务联合神经网络模型;然后训练端到端的联合神经网络模型;再优化端到端的联合神经网络模型,得到最终模型;最后通过最终模型构建家族图谱。本发明的多任务联合模型避免了在所有实体间两两配对进行关系分类,模型输出的冗余性大大降低。本发明提出的联合提取方法也能应用于其他的数据领域上,能在信息提取任务上体现出很好的时间效率和准确性。本发明从效率、精度两方面改善实体抽取及关系分类任务的表现,能灵活的扩展到构建家族图谱任务外的其他需要抽取实体,并进行关系分类的任务中去。

    一种应用于病理学组织分割的对比学习方法

    公开(公告)号:CN114240958A

    公开(公告)日:2022-03-25

    申请号:CN202111594975.8

    申请日:2021-12-23

    IPC分类号: G06T7/10 G06N3/04 G06N3/08

    摘要: 一种应用于病理学组织分割的对比学习方法,包括进行图像级对比学习任务;进行超像素级对比学习任务;进行像素级对比学习任务;三个层次的对比学习步骤,为病理学组织分割学习提供具有空间敏感性和平滑度的稳健密集表示,使得模型来学习病理组织分割图像从全局到局部对比的判别性表示,进而模型能够清晰地学习到细胞和细胞外基质的特征,有效提升了组织分割的精度。作为医学辅助工具,能显著提高病理学家的判别质量和工作效率。

    基于深度神经网络和标注策略的多标签实体-关系联合提取方法

    公开(公告)号:CN109543183B

    公开(公告)日:2021-01-19

    申请号:CN201811367895.7

    申请日:2018-11-16

    发明人: 李辰 龙雨 王轩

    摘要: 本发明提供基于深度神经网络和标注策略的多标签实体‑关系联合提取方法,基于标注策略的联合提取方法,可以有效的避免在命名实体识别子任务中产生的错误会传播至关系分类子任务中和忽视了两个子任务间相互作用的弊端。同时,本发明使用Tree‑GRU作为编码层,可以使模型更加充分的学习到整个句子的依存句法信息,为准确识别两个实体间是否存在关系及存在关系的类型带来帮助。此外,由于海量文本本身具有的复杂性,一个实体可能包含在多种关系中,多标签分类器的使用,很好地解决了上述问题。本发明的方法在不同的数据领域上都取得了较好的结果,能高效准确智能地从海量文本数据中提取有实用价值以及研究意义的信息。

    基于云端的大型病理学图像协作注释方法及系统

    公开(公告)号:CN109949907A

    公开(公告)日:2019-06-28

    申请号:CN201910252955.9

    申请日:2019-03-29

    IPC分类号: G16H30/40 G06F16/58 G06F16/51

    摘要: 本发明基于云端的大型病理学图像协作注释方法及系统,首先通过图像预处理模块,在云端通过超像素分割,对病理图片进行预先处理,同时以二值图像进行存储其边际;通过数据记录模块,进行多用户的数据记录,使用户可以协同标注图像;通过前端交互模块,完成对用户动作的捕获,以及病理图片的展示,通过后端处理模块,响应前端交互模块发来的请求,完成数据的标注以及对用户的可能标注区域的提示。通过以上模块所达到的效果,本发明完成在网页端对病理图片进行多人协作、像素级便捷标注的目的。

    基于深度神经网络和标注策略的多标签实体-关系联合提取方法

    公开(公告)号:CN109543183A

    公开(公告)日:2019-03-29

    申请号:CN201811367895.7

    申请日:2018-11-16

    发明人: 李辰 龙雨 王轩

    IPC分类号: G06F17/27 G06N3/04

    摘要: 本发明提供基于深度神经网络和标注策略的多标签实体-关系联合提取方法,基于标注策略的联合提取方法,可以有效的避免在命名实体识别子任务中产生的错误会传播至关系分类子任务中和忽视了两个子任务间相互作用的弊端。同时,本发明使用Tree-GRU作为编码层,可以使模型更加充分的学习到整个句子的依存句法信息,为准确识别两个实体间是否存在关系及存在关系的类型带来帮助。此外,由于海量文本本身具有的复杂性,一个实体可能包含在多种关系中,多标签分类器的使用,很好地解决了上述问题。本发明的方法在不同的数据领域上都取得了较好的结果,能高效准确智能地从海量文本数据中提取有实用价值以及研究意义的信息。

    基于多头注意力机制的图卷积网络生物医学信息提取方法

    公开(公告)号:CN113868374B

    公开(公告)日:2024-04-12

    申请号:CN202111083061.5

    申请日:2021-09-15

    摘要: 一种基于多头注意力机制的图卷积网络生物医学信息提取方法,首先建立基于多头注意力机制的图卷积网络模型;然后对该混合模型进行训练;再对模型进行优化,调整参数,得到最终模型;最后使用最终模型进行生物医学文本中的关系提取以及病理报告的特征提取;本发明在提高关系抽取的性能的能够同时有效降低噪声数据的影响,有效地保留了生物医学文本中长距离信息中有价值的内容;使用迁移学习方法处理不同格式和写作风格的病理报告,具有良好的通用性和可重用性;应用于以癌症病理报告为数据源的信息与关系提取,识别效果好,通用性强,有效提高病理检测效率。

    基于语义网技术的组织病理切片语义描述语言的建立及应用方法

    公开(公告)号:CN114896419A

    公开(公告)日:2022-08-12

    申请号:CN202210607760.3

    申请日:2022-05-31

    IPC分类号: G06F16/36 G06F40/30 G06V20/69

    摘要: 一种基于语义网技术的组织病理切片语义描述语言的建立及应用方法,其中语义描述语言的建立为:通过建立病理特征描述语言的基本项,包括本体类、对象属性与数据属性,能够表示病理切片中的更大范围的病理特征;在应用上,对组成该表型的的每一个实体、实体的属性、实体之间的关系进行细粒度描述,相较现有工作,能够大大降低表示的歧义性,另外,结合网络本体语言(OWL)自身具备的检索、推理等功能,能够进一步降低计算机传输、理解、分析复杂病理特征的难度;本发明能够对不同癌种的病理切片中出现的多元病理特征进行描述,实现对病理特征更加完整、精确的表示,为实现病理数据语义互操作性提供基础技术支撑。

    一种特大图像的存储与读写方法

    公开(公告)号:CN110910302B

    公开(公告)日:2021-08-13

    申请号:CN201911206466.6

    申请日:2019-11-29

    IPC分类号: G06T1/60 G06T1/00

    摘要: 本发明提供一种特大图像的存储与读写方法,能够支持对图像任意区域进行任意分辨率的读写操作的同时,提供更优的运行效率,占用更少的计算机资源。通过使用以金字塔结构保存图像数据的方法,使得每次读写只需将与操作区域相关的区块载入内存,而不是传统方法中的整张图像,使得特大图像分析与处理在低端配置的电脑上进行更加简便。并且本方法无需用户将图像再次分割为小块图像进行处理,节省了内存和硬盘空间。此外,本发明使得对于图像的局部修改不再需要重新生成整个图像文件,而是仅仅生成被修改区域,使得单次读写操作时空复杂度均为线性,大大提高了特大图像局部修改的性能。