一种文字信息碎片整合方法
    3.
    发明公开

    公开(公告)号:CN118626535A

    公开(公告)日:2024-09-10

    申请号:CN202410503061.3

    申请日:2024-04-25

    摘要: 本发明提供的一种文字信息碎片整合方法,涉及信息整合处理技术领域,其特征在于,包括以下步骤:步骤1、获取相应信息数据后分别进行信息分析与数据挖掘;步骤2、将步骤1中提取出的知识单元进行结构化加工,形成用XML表示的内容资源包,随后使用标引工具对内容进行标引数据处理;步骤3、将步骤2中XML资源包进行自然语言处理,所述自然语言处理包括新词发现、实体识别和关系抽取;步骤4、将步骤3中完成处理的文件结合知识图谱进行智能搜索,所述智能搜索会提取出相应的关键词以及表单信息等,随后通过匹配处理后进行结果展示。本发明的优点:文字信息识别精度高,方便整合管理。