-
公开(公告)号:CN105550253A
公开(公告)日:2016-05-04
申请号:CN201510900876.6
申请日:2015-12-09
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 葛宁
IPC: G06F17/30
CPC classification number: G06F16/5854 , G06F16/288 , G06F16/5846 , G06F16/90344
Abstract: 本发明实施例提供了一种类型关系的获取方法及装置。一方面,本发明实施例通过获得各实体以及各实体的描述文本;从而,获得各实体对应的类型,以及,根据每个类型对应的各实体的描述文本,生成每个类型的描述文本;进而,根据指定的类型关系,从每个类型的描述文本中抽取符合所述指定的类型关系的M组类型,M为正整数。因此,本发明实施例提供的技术方案能够自动获得实体的类型与类型之间的关系,提高了实体的类型与类型之间的关系的获取效率,降低了实体的类型与类型的关系的获取成本。
-
公开(公告)号:CN105468583A
公开(公告)日:2016-04-06
申请号:CN201510903342.9
申请日:2015-12-09
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 葛宁
IPC: G06F17/27
CPC classification number: G06F17/2785
Abstract: 本发明实施例提供了一种实体关系的获取方法及装置。一方面,本发明实施例通过根据符合指定关系的至少一个样本组,从网页文本中抽取包含各样本组的文本片段,每个所述样本组中包含两个样本实体;从而,对所述包含各样本组的文本片段进行数据泛化处理,以生成实体关系模板;进而,利用所述实体关系模板,从网页文本中抽取出符合所述指定关系的两个目标实体。因此,本发明实施例提供的技术方案能够自动获得实体与实体之间的关系,提高了实体与实体之间的关系的获取效率,降低了实体与实体之间的关系的获取成本。
-
公开(公告)号:CN105550168A
公开(公告)日:2016-05-04
申请号:CN201510917637.1
申请日:2015-12-10
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 葛宁
IPC: G06F17/27
CPC classification number: G06F17/2775
Abstract: 本发明公开了一种确定对象的概念词的方法和装置。其中一种确定对象的概念词的方法包括:基于待分析对象的领域知识库,从所述待分析对象的原始语料文档中提取特征词,构成特征词集合;对所述特征词集合中的各特征词进行n-gram处理,得到候选概念词集合,所述n取预设的一个或多个正整数;基于构成候选概念词的各特征词之间的紧密度、各候选概念词在所述原始语料文档中的重要度、以及候选概念词与所述待分析对象之间的相似度,从所述候选概念词集合中确定所述待分析对象的概念词。应用本发明所提供方法和装置,可以自动实现从所述候选概念词集合中确定所述待分析对象的概念词,降低了人力成本,且提高了概念词提取的准确性。
-
公开(公告)号:CN105512270A
公开(公告)日:2016-04-20
申请号:CN201510882827.4
申请日:2015-12-04
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 葛宁
IPC: G06F17/30
Abstract: 本发明公开了一种确定相关对象的方法和装置。其中一种确定相关对象的方法包括:依据对象的原始语料文档确定对象的对象类型和对象主题;按照对象类型聚合对象,得到一个以上的对象簇;依据同一对象簇中对象之间的主题相似度,获得待分析对象的相关对象。应用本发明所提供方法和装置,可以自动实现待分析对象的相关对象的确定,克服了现有技术中通过经验分析法进行数据分析造成的人力成本过高,并且分析结果受限于分析人员的经验和市场活动范围的缺陷。
-
公开(公告)号:CN105550168B
公开(公告)日:2019-01-15
申请号:CN201510917637.1
申请日:2015-12-10
Applicant: 百度在线网络技术(北京)有限公司
Inventor: 葛宁
IPC: G06F17/27
Abstract: 本发明公开了一种确定对象的概念词的方法和装置。其中一种确定对象的概念词的方法包括:基于待分析对象的领域知识库,从所述待分析对象的原始语料文档中提取特征词,构成特征词集合;对所述特征词集合中的各特征词进行n‑gram处理,得到候选概念词集合,所述n取预设的一个或多个正整数;基于构成候选概念词的各特征词之间的紧密度、各候选概念词在所述原始语料文档中的重要度、以及候选概念词与所述待分析对象之间的相似度,从所述候选概念词集合中确定所述待分析对象的概念词。应用本发明所提供方法和装置,可以自动实现从所述候选概念词集合中确定所述待分析对象的概念词,降低了人力成本,且提高了概念词提取的准确性。
-
-
-
-