-
公开(公告)号:CN115858814A
公开(公告)日:2023-03-28
申请号:CN202211644166.8
申请日:2022-12-20
Applicant: 上海大学
IPC: G06F16/36 , G06F16/33 , G06F40/295
Abstract: 本发明涉及信息抽取方法技术领域,且公开了基于全局指针解码方法的文本结构化信息抽取方法,包括以下算法及模型:(1)面向文本事件信息抽取的向量化表示;(2)统一方式处理嵌套与非嵌套NER任务;(3)设计事件抽取算法并完成模型训练;(4)设计事件关系抽取算法并完成模型训练;(5)完成最优化模型参数的部署对知识进行融合加工。本发明通过全局化的关联文本内容,用归一处理的全局指针解码方法方法来应对命名实体识别任务,不对嵌套实体和非嵌套实体作明确区分,使得形成的模型统一高效的处理两类文本,并将归一化的模型利用到两个抽取任务之中,实现从非结构化文本中抽取结构化有效信息的优点。