-
公开(公告)号:CN106156041B
公开(公告)日:2019-05-28
申请号:CN201510137773.9
申请日:2015-03-26
申请人: 科大讯飞股份有限公司 , 清华大学
IPC分类号: G06F16/2458 , G06F17/27
摘要: 本发明公开了一种热点信息发现方法及系统,该方法包括:获取待处理文本;对所述待处理文本进行分词及词性标注;对分词后的文本进行句法分析,得到所述待处理文本中每句话的依存句法树;去除待处理文本中每句话的依存句法树中的停用词,得到待分析依存句法树;利用所述待分析依存句法树构建小世界网络;根据所述待分析依存句法树及所述小世界网络进行热点分析;根据热点分析结果获取所述待处理文本中的热点信息。利用本发明,可以高效、准确地发现待处理文本中的热点信息。
-
公开(公告)号:CN106155999A
公开(公告)日:2016-11-23
申请号:CN201510166742.6
申请日:2015-04-09
申请人: 科大讯飞股份有限公司 , 清华大学
IPC分类号: G06F17/27
摘要: 本发明公开了一种自然语言语义理解方法及系统,该方法包括:获取待解析文本;对所述待解析文本进行分词及词性标注;基于上下文相关信息对分词后的文本进行句法分析,得到所述待处理文本中每句话的自然词依存句法树;根据所述自然词依存句法树及预先构建的本体知识库,构建语义树;利用所述语义树获取语义理解结果。利用本发明,可以提高自然语言语义理解的正确性及灵活性。
-
公开(公告)号:CN105224577A
公开(公告)日:2016-01-06
申请号:CN201410310719.5
申请日:2014-07-01
申请人: 清华大学 , 科大讯飞股份有限公司
摘要: 本发明公开了一种多标签文本分类方法及系统,包括:针对待分类文档确定待考核标签子集;对待分类文档进行分词处理;获取当前计算字词相应于当前考核标签子集中各标签的似然度;对当前计算字词相应于当前考核标签子集中各标签的似然度进行线性加权,得到当前计算字词相应于当前考核标签子集的加权似然度;确定进行线性加权的各加权系数,使得所有字词的加权似然度的连乘积最大,并将最大的连乘积作为待分类文档相应于当前考核标签子集的似然度;在待考核标签子集中,选取使得后验概率最大的标签子集作为待分类文档的分类结果。本发明的多标签分类方法及系统相对现有多标签分类方法及系统兼具总体性能高及计算量小的特点。
-
公开(公告)号:CN105989143B
公开(公告)日:2019-09-03
申请号:CN201510091477.X
申请日:2015-02-28
申请人: 科大讯飞股份有限公司 , 清华大学
IPC分类号: G06F16/9535
摘要: 本发明公开了一种网络实体热度分析方法及系统,该方法包括:获取网络实体热度相关信息,所述热度相关信息是指能够体现所述网络实体被用户关注程度的信息;根据所述网络实体热度相关信息构建不同类型网络实体实例间的链接关系图,所述链接关系图中每个节点代表一个网络实体实例;根据所述链接关系图中节点的热度空间值计算节点间的跳转概率,所述热度空间值指将所有网络实体实例的热度值划分到同一空间后,每个网络实体实例的热度值;根据所述跳转概率,计算每个节点的热度值。利用本发明,可以有效提高热度分析结果的可靠性、区分性和准确性。
-
公开(公告)号:CN106156042A
公开(公告)日:2016-11-23
申请号:CN201510137775.8
申请日:2015-03-26
申请人: 科大讯飞股份有限公司 , 清华大学
IPC分类号: G06F17/30
摘要: 本发明公开了一种热点信息展示方法及系统,该方法包括:获取待展示的热点信息及所述热点信息的重要度得分,每条热点信息包括两个相关联的热点;将所述热点信息按重要度得分从大到小进行排序,生成热点信息序列;依次选择所述热点信息序列中的每条热点信息构建热点信息图,所述热点信息图中,使用节点表示所述热点,使用边表示热点之间的联系;根据所述热点信息的重要度得分调整所述热点信息图中各节点的大小;将所述热点信息图展示给用户。利用本发明,可以将各热点之间的关联关系更直观地展现给用户,方便了用户的理解,可以更好地帮助用户从热点信息中快速提取有用信息,进而做出正确决策。
-
公开(公告)号:CN105224577B
公开(公告)日:2018-06-12
申请号:CN201410310719.5
申请日:2014-07-01
申请人: 清华大学 , 科大讯飞股份有限公司
摘要: 本发明公开了一种多标签文本分类方法及系统,包括:针对待分类文档确定待考核标签子集;对待分类文档进行分词处理;获取当前计算字词相应于当前考核标签子集中各标签的似然度;对当前计算字词相应于当前考核标签子集中各标签的似然度进行线性加权,得到当前计算字词相应于当前考核标签子集的加权似然度;确定进行线性加权的各加权系数,使得所有字词的加权似然度的连乘积最大,并将最大的连乘积作为待分类文档相应于当前考核标签子集的似然度;在待考核标签子集中,选取使得后验概率最大的标签子集作为待分类文档的分类结果。本发明的多标签分类方法及系统相对现有多标签分类方法及系统兼具总体性能高及计算量小的特点。
-
公开(公告)号:CN106156041A
公开(公告)日:2016-11-23
申请号:CN201510137773.9
申请日:2015-03-26
申请人: 科大讯飞股份有限公司 , 清华大学
摘要: 本发明公开了一种热点信息发现方法及系统,该方法包括:获取待处理文本;对所述待处理文本进行分词及词性标注;对分词后的文本进行句法分析,得到所述待处理文本中每句话的依存句法树;去除待处理文本中每句话的依存句法树中的停用词,得到待分析依存句法树;利用所述待分析依存句法树构建小世界网络;根据所述待分析依存句法树及所述小世界网络进行热点分析;根据热点分析结果获取所述待处理文本中的热点信息。利用本发明,可以高效、准确地发现待处理文本中的热点信息。
-
公开(公告)号:CN106156238A
公开(公告)日:2016-11-23
申请号:CN201510205659.5
申请日:2015-04-27
申请人: 科大讯飞股份有限公司 , 清华大学
IPC分类号: G06F17/30
摘要: 本发明公开了一种本体信息查询方法及系统,该方法包括:接收查询请求;根据所述查询请求构建查询树;采用正序和倒序相结合的方式遍历所述查询树的每个叶子节点,得到所述叶子节点中未知变量取值集合;如果所述未知变量在所述未知变量取值集合中都有对应的取值,则将所述未知变量取值集合作为查询结果。利用本发明,可以提高信息查询效率,降低对内存的消耗。
-
公开(公告)号:CN106156042B
公开(公告)日:2020-02-07
申请号:CN201510137775.8
申请日:2015-03-26
申请人: 科大讯飞股份有限公司 , 清华大学
IPC分类号: G06F16/9538
摘要: 本发明公开了一种热点信息展示方法及系统,该方法包括:获取待展示的热点信息及所述热点信息的重要度得分,每条热点信息包括两个相关联的热点;将所述热点信息按重要度得分从大到小进行排序,生成热点信息序列;依次选择所述热点信息序列中的每条热点信息构建热点信息图,所述热点信息图中,使用节点表示所述热点,使用边表示热点之间的联系;根据所述热点信息的重要度得分调整所述热点信息图中各节点的大小;将所述热点信息图展示给用户。利用本发明,可以将各热点之间的关联关系更直观地展现给用户,方便了用户的理解,可以更好地帮助用户从热点信息中快速提取有用信息,进而做出正确决策。
-
公开(公告)号:CN106156238B
公开(公告)日:2019-09-03
申请号:CN201510205659.5
申请日:2015-04-27
申请人: 科大讯飞股份有限公司 , 清华大学
摘要: 本发明公开了一种本体信息查询方法及系统,该方法包括:接收查询请求;根据所述查询请求构建查询树;采用正序和倒序相结合的方式遍历所述查询树的每个叶子节点,得到所述叶子节点中未知变量取值集合;如果所述未知变量在所述未知变量取值集合中都有对应的取值,则将所述未知变量取值集合作为查询结果。利用本发明,可以提高信息查询效率,降低对内存的消耗。
-
-
-
-
-
-
-
-
-