一种CRF识别器的训练及技术及其属性名关系对抽取方法

    公开(公告)号:CN106528863B

    公开(公告)日:2019-07-02

    申请号:CN201611090158.8

    申请日:2016-11-29

    IPC分类号: G06F16/951 G06F17/27

    摘要: 本发明公开了一种CRF识别器的训练方法,所述CRF识别器包括一个属性名CRF识别器和一个关系对CRF识别器,所述属性名CRF识别器和关系对CRF识别器都为CRF模型;所述方法包括:步骤1)建立属性名训练样本,提取属性名训练样本的属性名特征,作为属性名CRF识别器的输入,由此训练出属性名CRF识别器;步骤2)获取属性名CRF识别器输出的属性名,再根据与技术名词形成的所属关系搜集种子对,然后再收集语料,解析得到依存树,由此形成关系对训练样本,提取关系对训练样本的关系对特征,作为关系对CRF识别器的输入,由此训练出关系对CRF识别器;步骤3)将属性名CRF识别器和关系对CRF识别器连接在一起,即所述属性名CRF识别器的输出为关系对CRF识别器的输入,形成CRF识别器。

    一种命名实体模糊检索方法与系统

    公开(公告)号:CN106294875B

    公开(公告)日:2019-05-17

    申请号:CN201610727015.7

    申请日:2016-08-25

    IPC分类号: G06F16/36

    摘要: 本发明涉及一种命名实体模糊检索方法,包括:数据索引步骤,该步骤用于将文本切分成索引单元,进而形成索引文件;其中,所述索引单元包括正常索引词与实体类型词,所述实体类型词是用于表征命名实体类型的词;数据检索步骤,该步骤基于数据索引步骤所建立的数据索引,结合用户提供的检索式向用户提供检索服务。本发明还涉及一种命名实体模糊检索系统。本发明的检索方法与系统使得用户在检索信息时,可按实体类型检索信息,或者同时使用普通检索词和实体类型词进行检索,可有效提升信息检索系统的查全率和查准率。

    一种CRF识别器的训练及技术及其属性名关系对抽取方法

    公开(公告)号:CN106528863A

    公开(公告)日:2017-03-22

    申请号:CN201611090158.8

    申请日:2016-11-29

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明公开了一种CRF识别器的训练方法,所述CRF识别器包括一个属性名CRF识别器和一个关系对CRF识别器,所述属性名CRF识别器和关系对CRF识别器都为CRF模型;所述方法包括:步骤1)建立属性名训练样本,提取属性名训练样本的属性名特征,作为属性名CRF识别器的输入,由此训练出属性名CRF识别器;步骤2)获取属性名CRF识别器输出的属性名,再根据与技术名词形成的所属关系搜集种子对,然后再收集语料,解析得到依存树,由此形成关系对训练样本,提取关系对训练样本的关系对特征,作为关系对CRF识别器的输入,由此训练出关系对CRF识别器;步骤3)将属性名CRF识别器和关系对CRF识别器连接在一起,即所述属性名CRF识别器的输出为关系对CRF识别器的输入,形成CRF识别器。

    一种命名实体模糊检索方法与系统

    公开(公告)号:CN106294875A

    公开(公告)日:2017-01-04

    申请号:CN201610727015.7

    申请日:2016-08-25

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30734

    摘要: 本发明涉及一种命名实体模糊检索方法,包括:数据索引步骤,该步骤用于将文本切分成索引单元,进而形成索引文件;其中,所述索引单元包括正常索引词与实体类型词,所述实体类型词是用于表征命名实体类型的词;数据检索步骤,该步骤基于数据索引步骤所建立的数据索引,结合用户提供的检索式向用户提供检索服务。本发明还涉及一种命名实体模糊检索系统。本发明的检索方法与系统使得用户在检索信息时,可按实体类型检索信息,或者同时使用普通检索词和实体类型词进行检索,可有效提升信息检索系统的查全率和查准率。