-
公开(公告)号:CN101075228B
公开(公告)日:2012-05-23
申请号:CN200610079890.5
申请日:2006-05-15
Applicant: 松下电器产业株式会社
IPC: G06F17/27
CPC classification number: G06F17/278 , G06F17/2785 , G06F17/289 , G06K9/222
Abstract: 本发明提供了一种识别自然语言中的命名实体的方法,包括步骤:对自然语言执行逐步式解析模型训练,以获得分类模型;基于得到的所述分类模型对自然语言执行逐步式解析识别,以得到侯选命名实体的位置和类型信息;利用拒识器对侯选命名实体进行拒识处理;和对经过拒识处理的侯选命名实体生成侯选命名实体网络,并执行最优路径搜索。本发明使用候选命名实体的全局特征,在得到仅使用局部特征的前向解析识别结果和后向解析识别结果的基础上,使用一个单类分类器对这些结果进行打分或评判,来得到最为可靠的命名实体起始和终止边界。
-
公开(公告)号:CN101167075B
公开(公告)日:2010-05-12
申请号:CN200580049664.6
申请日:2005-12-26
Applicant: 松下电器产业株式会社
CPC classification number: G06F17/278
Abstract: 一种专有表现抽取装置,通过可以设定从文本中抽取专有表现的顺序,从而可以抽取适应用户的专有表现,该专有表现抽取装置包括:抽取顺序读取部(103),获得由抽取顺序存储部(102)存储的、与抽取顺序相对应的专有表现模式名;专有表现抽取部(105),使用与由抽取顺序读取部(103)获得的专有表现模式名相对应的专有表现模式,从输入文本中抽取专有表现;以及抽取结束判断部(106),在未结束抽取的情况下,向抽取顺序读取部(103)输出正在抽取的文本,继续进行专有表现抽取处理。
-
公开(公告)号:CN101606155A
公开(公告)日:2009-12-16
申请号:CN200880004181.8
申请日:2008-08-05
Applicant: 松下电器产业株式会社
IPC: G06F17/30
CPC classification number: G06F17/3064
Abstract: 内容检索装置(100),在用户的检索对象流动变化的情况下,也能够向该用户出示适当的关联关键字,内容检索装置(100)包括:内容推测部(107),检索按照检索关键字的内容;文档空间数据库(103),存储按照关键字的出现频度的多个文档空间;文档空间选择部(104),按照文档空间的出现频度,从文档空间数据库(103)中选择筛选文档空间以及扩展文档空间,所述文档空间示出检索关键字和对应于该检索关键字的内容的关联度;关联关键字推测部(108),将与筛选文档空间以及扩展文档空间分别相对应的关键字作为筛选关键字以及扩展关键字选择;以及输出部(111),限制所选择的筛选关键字以及扩展关键字。
-
公开(公告)号:CN101496011A
公开(公告)日:2009-07-29
申请号:CN200780028292.8
申请日:2007-10-30
Applicant: 松下电器产业株式会社
IPC: G06F17/30
CPC classification number: H04N7/17336 , G06F17/30817 , H04N21/4828 , H04N21/8405
Abstract: 一种内容检索装置,即使在内容和关键字之间的关联性发生变化的情况下,也能够容易地检索用户所希望的内容,其中包括:内容表存储部(108),记忆多个内容表(108a);输入部(112),取得所选择的关键字以作为选择关键字;关联关键字生成部(109),根据对象内容表(108a)来算出针对选择关键字的各个关键字的关联度,从各个关键字中选择预先决定了关联度的关键字,并生成关联关键字;分散算出部(106),用户处于困惑状态的情况下,算出多个选择关键字的分散值;以及内容表选择部(114),在分散值比阈值大的情况下,将上述的对象表(108a)变更为其他的内容表(108a)。
-
公开(公告)号:CN101167075A
公开(公告)日:2008-04-23
申请号:CN200580049664.6
申请日:2005-12-26
Applicant: 松下电器产业株式会社
CPC classification number: G06F17/278
Abstract: 一种专有表现抽取装置,通过可以设定从文本中抽取专有表现的顺序,从而可以抽取适应用户的专有表现,该专有表现抽取装置包括:抽取顺序读取部(103),获得由抽取顺序存储部(102)存储的、与抽取顺序相对应的专有表现模式名;专有表现抽取部(105),使用与由抽取顺序读取部(103)获得的专有表现模式名相对应的专有表现模式,从输入文本中抽取专有表现;以及抽取结束判断部(106),在未结束抽取的情况下,向抽取顺序读取部(103)输出正在抽取的文本,继续进行专有表现抽取处理。
-
公开(公告)号:CN101075228A
公开(公告)日:2007-11-21
申请号:CN200610079890.5
申请日:2006-05-15
Applicant: 松下电器产业株式会社
IPC: G06F17/27
CPC classification number: G06F17/278 , G06F17/2785 , G06F17/289 , G06K9/222
Abstract: 本发明提供了一种识别自然语言中的命名实体的方法,包括步骤:对自然语言执行逐步式解析模型训练,以获得分类模型;基于得到的所述分类模型对自然语言执行逐步式解析识别,以得到候选命名实体的位置和类型信息;利用拒识器对候选命名实体进行拒识处理;和对经过拒识处理的候选命名实体生成候选命名实体网络,并执行最优路径搜索。本发明使用候选命名实体的全局特征,在得到仅使用局部特征的前向解析识别结果和后向解析识别结果的基础上,使用一个单类分类器对这些结果进行打分或评判,来得到最为可靠的命名实体起始和终止边界。
-
-
-
-
-