用于共指消解、信息提取以及相似文档检索的装置和方法

    公开(公告)号:CN107515851A

    公开(公告)日:2017-12-26

    申请号:CN201610428860.4

    申请日:2016-06-16

    Inventor: 张碧川 黄耀海

    Abstract: 本发明公开了用于共指消解、信息提取以及相似文档检索的装置和方法。所述用于共指消解的装置包括:被构造为从输入的医学文档中获取第一医学实体和第二医学实体的单元;被构造为从所述医学文档中,检测所述第一医学实体的诊断状态、所述第一医学实体的至少一个属性、所述第二医学实体的诊断状态以及所述第二医学实体的至少一个属性的单元;被构造为基于所检测到的诊断状态和属性,确定所述第一医学实体与所述第二医学实体之间的兼容性的单元;以及被构造为基于所确定的兼容性,确定所述第一医学实体和第二医学实体是否表示同一医学对象的单元。采用本发明的优点,将提高共指消解的精确度。

    主题挖掘方法和设备、以及查询扩展方法和设备

    公开(公告)号:CN104298683B

    公开(公告)日:2017-11-28

    申请号:CN201310303056.X

    申请日:2013-07-18

    Abstract: 本发明涉及主题挖掘方法和设备及查询扩展方法和设备。该主题挖掘方法包括:获取步骤,从至少一个知识库中获取多个句子;识别步骤,对于所获取的多个句子中的每个句子,识别与其关联的实体,其中该实体指示物理物体或物理物体属性;生成步骤,从与每个句子关联的实体中各提取一个实体生成一个或更多个实体组;选择步骤,从该一个或更多个实体组中选择具有最大区别度的一个实体组;以及用户可见区别性物体主题输出步骤,输出与所获取的多个句子对应的用户可见区别性物体主题,其中每个用户可见区别性物体主题通过利用所获取的多个句子中的一个句子及其在所选的实体组中的对应实体来表示。得益于本发明,可以挖掘出隐含的用户查询主题从而提高召回率。

    用于意图挖掘的方法和设备

    公开(公告)号:CN104424216A

    公开(公告)日:2015-03-18

    申请号:CN201310371165.5

    申请日:2013-08-23

    CPC classification number: G06F17/30637

    Abstract: 本发明涉及用于意图挖掘的方法和设备。公开了一种用于意图挖掘的方法,所述方法包括:获取输入查询;针对所述输入查询生成意图类似查询,其中每一个意图类似查询具有与所述输入查询相同或类似的意图类型;针对每一个意图类似查询挖掘一组意图,其中每个意图提供针对相应的意图类似查询的子主题;通过使用所述意图类似查询的全部的意图组来确定类似意图信息描述集;以及通过使用所述类似意图信息描述集来挖掘针对所述输入查询的意图。

    用于共指消解、信息提取以及相似文档检索的装置和方法

    公开(公告)号:CN107515851B

    公开(公告)日:2021-09-10

    申请号:CN201610428860.4

    申请日:2016-06-16

    Inventor: 张碧川 黄耀海

    Abstract: 本发明公开了用于共指消解、信息提取以及相似文档检索的装置和方法。所述用于共指消解的装置包括:被构造为从输入的医学文档中获取第一医学实体和第二医学实体的单元;被构造为从所述医学文档中,检测所述第一医学实体的诊断状态、所述第一医学实体的至少一个属性、所述第二医学实体的诊断状态以及所述第二医学实体的至少一个属性的单元;被构造为基于所检测到的诊断状态和属性,确定所述第一医学实体与所述第二医学实体之间的兼容性的单元;以及被构造为基于所确定的兼容性,确定所述第一医学实体和第二医学实体是否表示同一医学对象的单元。采用本发明的优点,将提高共指消解的精确度。

    用于确定具有区别性事实的近似判断的方法和装置

    公开(公告)号:CN105630788A

    公开(公告)日:2016-06-01

    申请号:CN201410587566.9

    申请日:2014-10-28

    Inventor: 张碧川 黄耀海

    Abstract: 本发明涉及用于确定具有区别性事实的近似判断的方法和装置。所述方法包括:获得文档,其中所获得的文档包含第一判断项,并且第一判断项是预定类型的关键词;从所获得的文档中提取第一判断项和第一事实项,其中每一个第一事实项是与第一判断项相关联的信息;使用第一判断项和第一事实项获得第一组类似文档,并且从第一组类似文档中提取不同于第一判断项的第二判断项和第二事实项;以及通过使用第一组类似文档以及第二判断项和第二事实项,检测至少一个具有区别性事实的近似判断。

    内容提取方法、内容提取装置和用于内容提取的系统

    公开(公告)号:CN105335416A

    公开(公告)日:2016-02-17

    申请号:CN201410380780.7

    申请日:2014-08-05

    Abstract: 本发明涉及内容提取方法、内容提取装置和用于内容提取的系统。内容提取方法包括:提取输入文档中的多个主题内容区域;对于至少一部分主题内容区域中的每个主题内容区域,确定该主题内容区域的结构类型,其中所述结构类型通过该主题内容区域中包含的元素确定;对于所述每个主题内容区域,根据该主题内容区域的结构类型识别该主题内容区域中的兴趣内容,其中该主题内容区域中的兴趣内容指示该主题内容区域中最可能被用户注意的至少一个元素;以及根据用户输入动作和所述每个主题内容区域中的兴趣内容,提取响应于用户输入动作的主题内容区域。通过使用主题内容区域和兴趣内容,可以在能够向用户提供有意义的内容的同时提高内容提取的准确度。

    用于确定具有区别性事实的近似判断的方法和装置

    公开(公告)号:CN105630788B

    公开(公告)日:2019-05-03

    申请号:CN201410587566.9

    申请日:2014-10-28

    Inventor: 张碧川 黄耀海

    Abstract: 本发明涉及用于确定具有区别性事实的近似判断的方法和装置。所述方法包括:获得文档,其中所获得的文档包含第一判断项,并且第一判断项是预定类型的关键词;从所获得的文档中提取第一判断项和第一事实项,其中每一个第一事实项是与第一判断项相关联的信息;使用第一判断项和第一事实项获得第一组类似文档,并且从第一组类似文档中提取不同于第一判断项的第二判断项和第二事实项;以及通过使用第一组类似文档以及第二判断项和第二事实项,检测至少一个具有区别性事实的近似判断。

    主题挖掘方法和设备、以及查询扩展方法和设备

    公开(公告)号:CN104298683A

    公开(公告)日:2015-01-21

    申请号:CN201310303056.X

    申请日:2013-07-18

    CPC classification number: G06F17/30646 G06F2216/03

    Abstract: 本发明涉及主题挖掘方法和设备及查询扩展方法和设备。该主题挖掘方法包括:获取步骤,从至少一个知识库中获取多个句子;识别步骤,对于所获取的多个句子中的每个句子,识别与其关联的实体,其中该实体指示物理物体或物理物体属性;生成步骤,从与每个句子关联的实体中各提取一个实体生成一个或更多个实体组;选择步骤,从该一个或更多个实体组中选择具有最大区别度的一个实体组;以及用户可见区别性物体主题输出步骤,输出与所获取的多个句子对应的用户可见区别性物体主题,其中每个用户可见区别性物体主题通过利用所获取的多个句子中的一个句子及其在所选的实体组中的对应实体来表示。得益于本发明,可以挖掘出隐含的用户查询主题从而提高召回率。

    用于意图挖掘的方法和设备

    公开(公告)号:CN104424216B

    公开(公告)日:2018-01-23

    申请号:CN201310371165.5

    申请日:2013-08-23

    Abstract: 本发明涉及用于意图挖掘的方法和设备。公开了一种用于意图挖掘的方法,所述方法包括:获取输入查询;针对所述输入查询生成意图类似查询,其中每一个意图类似查询具有与所述输入查询相同或类似的意图类型;针对每一个意图类似查询挖掘一组意图,其中每个意图提供针对相应的意图类似查询的子主题;通过使用所述意图类似查询的全部的意图组来确定类似意图信息描述集;以及通过使用所述类似意图信息描述集来挖掘针对所述输入查询的意图。

    未登录属性抽取方法和装置

    公开(公告)号:CN108932223A

    公开(公告)日:2018-12-04

    申请号:CN201710374631.3

    申请日:2017-05-24

    Abstract: 本发明提供一种从医学文档中抽取未登录属性的未登录属性抽取方法和装置。所述未登录属性抽取装置包括:获取单元,配置为从文本文档中获取文本语句;属性抽取单元,配置为从所述文本语句中抽取已登录属性、候选未登录属性、所述已登录属性之间的关系以及所述已登录属性与所述候选未登录属性之间的关系;未登录属性识别单元,配置为在所述候选未登录属性满足通用属性结构的一部分的情况下将所述候选未登录属性识别为未登录属性。

Patent Agency Ranking