-
公开(公告)号:CN111291156B
公开(公告)日:2024-01-12
申请号:CN202010068158.8
申请日:2020-01-21
申请人: 同方知网(北京)技术有限公司 , 同方知网数字出版技术股份有限公司
IPC分类号: G06F16/33 , G06F16/332 , G06F16/35 , G06F16/36 , G06N3/0464 , G06N3/09
摘要: 本发明公开了一种基于知识图谱的问答意图识别方法,该方法包括:构建领域主题词典;构建模板;对检索语句进行词性分析和句法依存分析;利用词向量及LDA算法计算搜索文本与模板样例的相似度;在已知的词向量基础上,基于TextCNN做更广泛的意图识别来作为开放式信息的结果;在领域图谱中提取关键词。本发明综合多种方法以实现意图识别,并结合领域的知识图谱,达到精确答案与相关信息的综合检索,满足用户的多样需求。
-
公开(公告)号:CN111291156A
公开(公告)日:2020-06-16
申请号:CN202010068158.8
申请日:2020-01-21
申请人: 同方知网(北京)技术有限公司 , 同方知网数字出版技术股份有限公司
摘要: 本发明公开了一种基于知识图谱的问答意图识别方法,该方法包括:构建领域主题词典;构建模板;对检索语句进行词性分析和句法依存分析;利用词向量及LDA算法计算搜索文本与模板样例的相似度;在已知的词向量基础上,基于TextCNN做更广泛的意图识别来作为开放式信息的结果;在领域图谱中提取关键词。本发明综合多种方法以实现意图识别,并结合领域的知识图谱,达到精确答案与相关信息的综合检索,满足用户的多样需求。
-
公开(公告)号:CN111241827B
公开(公告)日:2022-05-20
申请号:CN202010025572.0
申请日:2020-01-10
申请人: 同方知网(北京)技术有限公司 , 同方知网数字出版技术股份有限公司
IPC分类号: G06F40/289 , G06F40/211 , G06F40/242 , G06F16/31 , G06F16/33
摘要: 本发明公开了一种基于句子检索模式的属性抽取方法,该包括:将语料进行预处理,把需要的语料数据导入到语料库;从语料库中或词典或概念模型中的语料数据中抽取语句,并将所需语句组成样本集;采用HanLP句法依存分析器对抽取的语句样本集进行分词和词性标注;采用过滤规则对词性标注的结果集进行过滤,并产生三元属性即:实体属性、关系属性以及实体与实体之间的属性,并得到每一句话的三元组属性集合;对三元组属性集合进行聚合,并将聚合得到的属性集合保存到数据库。本发明提高了关系抽取的效率,减少了人力物力等资源的浪费,解决了现有关系抽取技术的不足之处。
-
公开(公告)号:CN111259064A
公开(公告)日:2020-06-09
申请号:CN202010025564.6
申请日:2020-01-10
申请人: 同方知网(北京)技术有限公司 , 同方知网数字出版技术股份有限公司
摘要: 本发明公开了一种可视化的自然语言分析挖掘系统及其建模方法,所述系统包括可视化算法组件模块、后台分析模块、存储模块、结果展示模块与模型再训练模块;所述建模方法包括选择预设计的图形化算法组件拖拽至画布构建具体的自然语言分析挖掘流程,确定流程过程中各算法之间的数据流向,生成流程描述语言,并发送请求到后台分析模块;后台分析模块对流程DAG图进行逻辑解析,采用拓扑排序算法生成组件的调用顺序序列;按照流程描述语言执行具体的挖掘分析逻辑;流程技术生成结构化的分析结果,并使用存储模块进行存储;对分析结果进行查看并审核;对审核后的数据通过用户算法模型再优化训练。
-
公开(公告)号:CN111241827A
公开(公告)日:2020-06-05
申请号:CN202010025572.0
申请日:2020-01-10
申请人: 同方知网(北京)技术有限公司 , 同方知网数字出版技术股份有限公司
IPC分类号: G06F40/289 , G06F40/211 , G06F40/242 , G06F16/31 , G06F16/33
摘要: 本发明公开了一种基于句子检索模式的属性抽取方法,该包括:将语料进行预处理,把需要的语料数据导入到语料库;从语料库中或词典或概念模型中的语料数据中抽取语句,并将所需语句组成样本集;采用HanLP句法依存分析器对抽取的语句样本集进行分词和词性标注;采用过滤规则对词性标注的结果集进行过滤,并产生三元属性即:实体属性、关系属性以及实体与实体之间的属性,并得到每一句话的三元组属性集合;对三元组属性集合进行聚合,并将聚合得到的属性集合保存到数据库。本发明提高了关系抽取的效率,减少了人力物力等资源的浪费,解决了现有关系抽取技术的不足之处。
-
公开(公告)号:CN111259064B
公开(公告)日:2023-07-28
申请号:CN202010025564.6
申请日:2020-01-10
申请人: 同方知网数字出版技术股份有限公司
摘要: 本发明公开了一种可视化的自然语言分析挖掘系统及其建模方法,所述系统包括可视化算法组件模块、后台分析模块、存储模块、结果展示模块与模型再训练模块;所述建模方法包括选择预设计的图形化算法组件拖拽至画布构建具体的自然语言分析挖掘流程,确定流程过程中各算法之间的数据流向,生成流程描述语言,并发送请求到后台分析模块;后台分析模块对流程DAG图进行逻辑解析,采用拓扑排序算法生成组件的调用顺序序列;按照流程描述语言执行具体的挖掘分析逻辑;流程技术生成结构化的分析结果,并使用存储模块进行存储;对分析结果进行查看并审核;对审核后的数据通过用户算法模型再优化训练。
-
-
-
-
-