-
公开(公告)号:CN107797981B
公开(公告)日:2021-06-04
申请号:CN201610790466.5
申请日:2016-08-31
申请人: 科大讯飞股份有限公司
IPC分类号: G06F40/279
摘要: 本发明实施例提供了一种目标文本识别方法及装置,其中方法包括:获取待处理的文本,所述文本包含一条或多条自然语言语句;获取每条语句的特征值,其中所述特征值为所述语句是目标语句的概率;根据每条语句的特征值获取所述文本的预设指标值;根据所述预设指标值及预先构建的目标文本识别模型,对所述文本是否属于目标文本进行识别。本发明可自动评判一篇文本是否属于目标文本(例如优美文章),从而大大提高了目标文本的识别效率;同时,本发明的识别标准是基于客观的特征及模型,使得识别结果也较为客观,从而避免了人工识别时的主观性问题。
-
公开(公告)号:CN108763535B
公开(公告)日:2020-02-07
申请号:CN201810550870.4
申请日:2018-05-31
申请人: 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F16/33
摘要: 本发明实施例提供一种信息获取方法及装置,属于自然语言处理技术领域。方法包括:将问询文本和与问询文本相匹配的答复文本输入至关键内容计算模型,输出答复文本中的关键内容,并将关键内容作为问询文本的答复;其中,关键内容计算模型是基于样本问询文本、样本答复文本以及样本答复文本中的样本关键内容进行训练后得到,关键内容为样本问询文本的答复。由于可依据与问询文本相匹配的答复文本,并可直接针对问询文本本身来获取问询文本对应提问的答复内容,而非基于问询文本对应提问的相似问题,将相似问题对应的解答作为答复内容,从而可提高答复内容的可靠性及准确性,并提高了用户在与设备进行问答交互时的使用体验。
-
公开(公告)号:CN108763535A
公开(公告)日:2018-11-06
申请号:CN201810550870.4
申请日:2018-05-31
申请人: 科大讯飞股份有限公司
IPC分类号: G06F17/30
摘要: 本发明实施例提供一种信息获取方法及装置,属于自然语言处理技术领域。方法包括:将问询文本和与问询文本相匹配的答复文本输入至关键内容计算模型,输出答复文本中的关键内容,并将关键内容作为问询文本的答复;其中,关键内容计算模型是基于样本问询文本、样本答复文本以及样本答复文本中的样本关键内容进行训练后得到,关键内容为样本问询文本的答复。由于可依据与问询文本相匹配的答复文本,并可直接针对问询文本本身来获取问询文本对应提问的答复内容,而非基于问询文本对应提问的相似问题,将相似问题对应的解答作为答复内容,从而可提高答复内容的可靠性及准确性,并提高了用户在与设备进行问答交互时的使用体验。
-
公开(公告)号:CN108090098A
公开(公告)日:2018-05-29
申请号:CN201611045923.4
申请日:2016-11-22
申请人: 科大讯飞股份有限公司
IPC分类号: G06F17/30
摘要: 本发明实施例提供了一种文本处理方法及装置,其中方法包括:获取待处理文本数据;根据文本分类模型获取所述文本数据属于每个预设类别的概率,其中所述文本分类模型用于根据所述文本数据的标题及所述文本数据所包含的句子对所述文本数据分类;根据所述文本数据属于每个预设类别的概率确定所述文本数据的类别。在本发明实施例中,使用文本分类模型从标题+全文这种篇章角度对待分类文本进行分类,得到当前文本属于每个预设类别的概率,再在此基础上最终确定文本的类别,这样有效地提高了文本分类的效率,同时也提高了文本分类的准确性,降低了人的主观性对分类结果的影响。
-
公开(公告)号:CN107844471A
公开(公告)日:2018-03-27
申请号:CN201610836053.6
申请日:2016-09-20
申请人: 科大讯飞股份有限公司
CPC分类号: G06F17/279 , G06F17/271 , G06F17/2775 , G06F17/30705
摘要: 本发明提供了一种文本描写类型识别方法及装置,其中方法包括:获取目标描写类型及所述目标描写类型的描写搭配种子集合,其中每个描写搭配由描写对象及描写词组成;根据第一预设规则及预先构建的无类型描写搭配集合对所述描写搭配种子集合进行增长,以得到描写搭配扩展集合;获取待识别的文本数据,并根据所述描写搭配扩展集合识别所述文本数据是否包含所述目标描写类型。本发明从目标描写类型的描写搭配种子集合出发,得到描写搭配扩展集合,然后据此识别所述文本数据是否包含所述目标描写类型,从而实现了目标描写类型识别的自动化,大大减少了人工工作量,提高了识别的效率,同时避免了人工主观识别的负面影响,从而也提高了识别的准确性。
-
公开(公告)号:CN107797981A
公开(公告)日:2018-03-13
申请号:CN201610790466.5
申请日:2016-08-31
申请人: 科大讯飞股份有限公司
IPC分类号: G06F17/27
CPC分类号: G06F17/2765
摘要: 本发明实施例提供了一种目标文本识别方法及装置,其中方法包括:获取待处理的文本,所述文本包含一条或多条自然语言语句;获取每条语句的特征值,其中所述特征值为所述语句是目标语句的概率;根据每条语句的特征值获取所述文本的预设指标值;根据所述预设指标值及预先构建的目标文本识别模型,对所述文本是否属于目标文本进行识别。本发明可自动评判一篇文本是否属于目标文本(例如优美文章),从而大大提高了目标文本的识别效率;同时,本发明的识别标准是基于客观的特征及模型,使得识别结果也较为客观,从而避免了人工识别时的主观性问题。
-
公开(公告)号:CN111597314B
公开(公告)日:2023-01-17
申请号:CN202010314131.2
申请日:2020-04-20
申请人: 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F16/335 , G06F16/338
摘要: 本发明公开了一种推理问答方法、装置以及设备。具体是提出源于实体共现思路的启发式文档检索算法,其能够有效检索出复杂问题所隐含的相关线索文档,同时可以平衡算法效率与准确性;此外,提出了将检索出的目标文档进行拓扑化,作为后续解答、抽取答案的基础;最后再综合用户输入、线索文档、拓扑结构等信息,模拟出人类在推理复杂问题时的推导过程,这样便可针对复杂问题进行精准解答,这其中涉及的检索环节、构建图结构环节以及推理解答环节,相互依赖且步步相关,通过对每一个环节的设计及改进,共同完成了本发明提出的推理问答机制。
-
公开(公告)号:CN108241609B
公开(公告)日:2022-02-01
申请号:CN201611206317.6
申请日:2016-12-23
申请人: 科大讯飞股份有限公司
IPC分类号: G06F40/279
摘要: 本发明公开了一种排比句识别方法及系统,该方法包括:接收待分析文本;对所述文本进行结构化处理;从处理后的文本中获取候选排比句组;从所述排比句组中提取排比句特征;利用所述排比句特征对所述候选排比句组进行排比句识别判定。本发明从抽象出的排比句特有特征进行文本分析,从而可以得到全面、准确的识别判断结果。
-
公开(公告)号:CN108959388B
公开(公告)日:2020-09-11
申请号:CN201810551680.4
申请日:2018-05-31
申请人: 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06N3/04 , G06N3/08
摘要: 本发明实施例提供一种信息生成方法及装置,属于自然语言处理技术领域。方法包括:将问询文本和与问询文本相匹配的答复文本输入至关键内容计算模型,输出答复文本中的关键内容;将问询文本及关键内容输入至回复生成模型,输出对关键内容进行调整后得到的答复信息。由于可通过回复生成模型对关键内容进行调整,从而可筛选掉关键内容中与用户提问没有直接关联的内容,并加深对关键内容中与用户提问相关的信息挖掘,进而保证答复信息的准确性。另外,由于还可通过回复生成模型调整关键内容的表述方式,从而使得调整后得到的答复信息更加人性化,进而提高后续用户的交互体验。
-
公开(公告)号:CN111597314A
公开(公告)日:2020-08-28
申请号:CN202010314131.2
申请日:2020-04-20
申请人: 科大讯飞股份有限公司
IPC分类号: G06F16/332 , G06F16/335 , G06F16/338
摘要: 本发明公开了一种推理问答方法、装置以及设备。具体是提出源于实体共现思路的启发式文档检索算法,其能够有效检索出复杂问题所隐含的相关线索文档,同时可以平衡算法效率与准确性;此外,提出了将检索出的目标文档进行拓扑化,作为后续解答、抽取答案的基础;最后再综合用户输入、线索文档、拓扑结构等信息,模拟出人类在推理复杂问题时的推导过程,这样便可针对复杂问题进行精准解答,这其中涉及的检索环节、构建图结构环节以及推理解答环节,相互依赖且步步相关,通过对每一个环节的设计及改进,共同完成了本发明提出的推理问答机制。
-
-
-
-
-
-
-
-
-