-
公开(公告)号:CN106528863B
公开(公告)日:2019-07-02
申请号:CN201611090158.8
申请日:2016-11-29
申请人: 中国国防科技信息中心
IPC分类号: G06F16/951 , G06F17/27
摘要: 本发明公开了一种CRF识别器的训练方法,所述CRF识别器包括一个属性名CRF识别器和一个关系对CRF识别器,所述属性名CRF识别器和关系对CRF识别器都为CRF模型;所述方法包括:步骤1)建立属性名训练样本,提取属性名训练样本的属性名特征,作为属性名CRF识别器的输入,由此训练出属性名CRF识别器;步骤2)获取属性名CRF识别器输出的属性名,再根据与技术名词形成的所属关系搜集种子对,然后再收集语料,解析得到依存树,由此形成关系对训练样本,提取关系对训练样本的关系对特征,作为关系对CRF识别器的输入,由此训练出关系对CRF识别器;步骤3)将属性名CRF识别器和关系对CRF识别器连接在一起,即所述属性名CRF识别器的输出为关系对CRF识别器的输入,形成CRF识别器。
-
公开(公告)号:CN106294875B
公开(公告)日:2019-05-17
申请号:CN201610727015.7
申请日:2016-08-25
申请人: 中国国防科技信息中心
IPC分类号: G06F16/36
摘要: 本发明涉及一种命名实体模糊检索方法,包括:数据索引步骤,该步骤用于将文本切分成索引单元,进而形成索引文件;其中,所述索引单元包括正常索引词与实体类型词,所述实体类型词是用于表征命名实体类型的词;数据检索步骤,该步骤基于数据索引步骤所建立的数据索引,结合用户提供的检索式向用户提供检索服务。本发明还涉及一种命名实体模糊检索系统。本发明的检索方法与系统使得用户在检索信息时,可按实体类型检索信息,或者同时使用普通检索词和实体类型词进行检索,可有效提升信息检索系统的查全率和查准率。
-
公开(公告)号:CN106528863A
公开(公告)日:2017-03-22
申请号:CN201611090158.8
申请日:2016-11-29
申请人: 中国国防科技信息中心
CPC分类号: G06F16/951 , G06F17/271 , G06F17/277 , G06F17/2775
摘要: 本发明公开了一种CRF识别器的训练方法,所述CRF识别器包括一个属性名CRF识别器和一个关系对CRF识别器,所述属性名CRF识别器和关系对CRF识别器都为CRF模型;所述方法包括:步骤1)建立属性名训练样本,提取属性名训练样本的属性名特征,作为属性名CRF识别器的输入,由此训练出属性名CRF识别器;步骤2)获取属性名CRF识别器输出的属性名,再根据与技术名词形成的所属关系搜集种子对,然后再收集语料,解析得到依存树,由此形成关系对训练样本,提取关系对训练样本的关系对特征,作为关系对CRF识别器的输入,由此训练出关系对CRF识别器;步骤3)将属性名CRF识别器和关系对CRF识别器连接在一起,即所述属性名CRF识别器的输出为关系对CRF识别器的输入,形成CRF识别器。
-
公开(公告)号:CN106294875A
公开(公告)日:2017-01-04
申请号:CN201610727015.7
申请日:2016-08-25
申请人: 中国国防科技信息中心
IPC分类号: G06F17/30
CPC分类号: G06F17/30734
摘要: 本发明涉及一种命名实体模糊检索方法,包括:数据索引步骤,该步骤用于将文本切分成索引单元,进而形成索引文件;其中,所述索引单元包括正常索引词与实体类型词,所述实体类型词是用于表征命名实体类型的词;数据检索步骤,该步骤基于数据索引步骤所建立的数据索引,结合用户提供的检索式向用户提供检索服务。本发明还涉及一种命名实体模糊检索系统。本发明的检索方法与系统使得用户在检索信息时,可按实体类型检索信息,或者同时使用普通检索词和实体类型词进行检索,可有效提升信息检索系统的查全率和查准率。
-
-
-