-
公开(公告)号:CN115495567A
公开(公告)日:2022-12-20
申请号:CN202211305485.6
申请日:2022-10-24
申请人: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F16/332 , G06F16/33 , G06F16/35 , G06F40/30 , G06K9/62
摘要: 本发明提供一种问题聚类方法、装置、电子设备和存储介质,其中方法包括:获取第一问题簇,所述第一问题簇包括待聚类的第一问题;确定所述第一问题簇中的基准问题及其基准回复,以及所述第一问题簇中的第一问题以所述基准回复作为对话回复的回复概率;基于所述第一问题的回复概率,对所述第一问题进行聚类,得到第二问题簇。本发明提供的方法、装置、电子设备和存储介质,基于第一问题以基准回复作为对话回复的回复概率进行问题聚类,使得问题聚类的依据能够更加贴合实际对话场景下的问题语义,由此保证问题聚类的可靠性,优化问题聚类效果。
-
公开(公告)号:CN113435179B
公开(公告)日:2024-04-30
申请号:CN202110705457.2
申请日:2021-06-24
申请人: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F40/205 , G06F40/211 , G06F40/216 , G06F40/232 , G06F40/253 , G06F40/289
摘要: 本申请提供了一种作文评阅方法、装置、设备及存储介质,其中,方法包括:检测待评阅的目标作文是否为异常作文;若否,则分别从字词级别、句子级别、篇章级别对目标作文进行批改,以得到目标作文分别在字词级别、句子级别、篇章级别上对应的批改结果;从多个评阅维度确定目标作文的评分分档,以得到目标作文在多个评阅维度上的评分分档;根据目标作文在多个评阅维度上的评分分档生成目标作文的评语。本申请提供的作文评阅方法可自动对待评阅作文进行评阅,由于不需要人工参与,因此避免了人工参与所带来的问题,并且,经由本申请提供的作文评阅方法可获得内容丰富的评阅结果,内容丰富的评阅结果能够对写作者起到很好的指导作用,用户体验较好。
-
公开(公告)号:CN113705240B
公开(公告)日:2024-04-19
申请号:CN202110888038.7
申请日:2021-08-03
申请人: 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司
摘要: 本申请公开了一种基于多语种分支模型的文本处理方法及相关装置,所述多语种分支模型包括嵌入层、多分支处理网络、第一混合器、共享网络和输出层,所述文本处理方法包括:基于所述嵌入层,获得待处理的文本对应的初始语义表示;基于所述多分支处理网络、所述第一混合器以及所述共享网络,对所述初始语义表示进行处理以获得综合语义表示;基于所述输出层,对所述综合语义表示进行变换以获得输出结果。通过上述方式,本申请能够在具备多语种处理能力的基础上,提高处理结果的精确度。
-
公开(公告)号:CN117520481A
公开(公告)日:2024-02-06
申请号:CN202311576882.1
申请日:2023-11-23
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F16/33 , G06F16/35 , G06F18/241 , G06F18/2431 , G06N3/096 , G06N3/09 , G06N3/088
摘要: 本发明提供一种信息检索方法、装置、电子设备和存储介质,涉及自然语言处理技术领域。其中方法包括:将用于检索的输入文本输入至意图识别模型,得到所述意图识别模型输出的意图识别结果;基于所述意图识别结果,确定所述输入文本对应的目标意图;输出所述目标意图对应的信息检索结果;其中,所述意图识别模型是基于第一样本文本和所述第一样本文本对应的第一意图标签,对初始识别模型进行训练得到的,所述初始识别模型包括多个子识别模型,任一所述子识别模型包括依次连接的预训练模型和分类器,所述多个子识别模型中的预训练模型不同。本发明提供的方法、装置、电子设备和存储介质可以提高意图识别的准确性,进而提高信息检索的准确性。
-
公开(公告)号:CN117252210A
公开(公告)日:2023-12-19
申请号:CN202311266141.3
申请日:2023-09-27
申请人: 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司
IPC分类号: G06F40/35 , G06F40/166 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06N20/00
摘要: 本发明提供一种语义补全方法、装置、电子设备及存储介质,其中方法包括:获取待补全语句、在所述待补全语句之前发生的历史对话,以及所述历史对话中历史语句的缺失片段和/或补全语句;基于所述历史语句、所述缺失片段和所述补全语句中的至少两者之间的关系,对所述历史对话进行语义增强,得到增强历史表示;基于所述增强历史表示,对所述待补全语句进行语义补全,历史语句、缺失片段和补全语句中至少两者之间的关系,显式地反映语义补全模式,能反映多轮历史对话下不同粒度语义补全模式,增强对复杂历史对话的语义补全能力,进而提高补全语句的完整性和准确性。
-
公开(公告)号:CN115952784A
公开(公告)日:2023-04-11
申请号:CN202211652243.4
申请日:2022-12-21
申请人: 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/211 , G06F40/289 , G06F40/30
摘要: 本发明公开了一种文本润色方法、装置、电子设备和存储介质,属于自然语言处理技术领域,其中,文本润色方法包括:获取待润色文本;对所述待润色文本进行编码,得到所述待润色文本对应的向量表示,并获取所述待润色文本对应的技法差异向量,基于所述待润色文本对应的向量表示和所述技法差异向量,得到所述待润色文本对应的润色文本;其中,所述技法差异向量用于控制对所述待润色文本进行技法润色的方向和程度。本发明可以对待润色文本进行多技法润色,能够自适应控制多技法润色文本生成。
-
公开(公告)号:CN115858724A
公开(公告)日:2023-03-28
申请号:CN202211132099.1
申请日:2022-09-16
申请人: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F16/33 , G06F16/332 , G06N5/02
摘要: 本申请提供一种问答处理方法、装置、电子设备及存储介质,所述问答处理方法,包括:获取待处理问题;根据所述待处理问题,以及所述待处理问题的先验知识,确定与所述待处理问题对应的答案线索文本;所述待处理问题的先验知识至少包括所述待处理问题所属领域的知识;基于所述答案线索文本,确定对应所述待处理问题的答案。该方法还原了人面临问题时对问题的处理过程,以答案线索文本作为对待处理问题相关知识和概念的理解,答案线索文本为确定待处理问题的答案提供了强有力的保障和信息参考,从而可以提高待处理问题的答案的准确性。
-
公开(公告)号:CN115712714A
公开(公告)日:2023-02-24
申请号:CN202211506783.1
申请日:2022-11-28
申请人: 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F16/332 , G06F16/35 , G06F40/30 , G06F18/2431 , G06N3/0455 , G06N3/08
摘要: 本发明公开了一种文本纠错方法、系统以及设备,文本纠错方法,包括:接收待纠错文本;对待纠错文本进行粗粒度情感分析,获得第一粗粒度情感分类结果;对待纠错文本中表示情感的短语进行细粒度情感分析,获得短语的第一细粒度情感分类结果,第一粗粒度情感分类结果和第一细粒度情感分类结果均包括正向情感和负向情感;判断第一粗粒度情感分类结果与第一细粒度情感分类结果是否一致,获得一致性检测结果;若一致性检测结果为不一致,则将短语作为待纠错短语,对待纠错短语进行纠错,获得纠错后文本,并输出一致性检测结果和纠错后文本。本发明实现了文本的深层次的纠错机制,填补了技术空白。
-
公开(公告)号:CN115169297A
公开(公告)日:2022-10-11
申请号:CN202210709307.3
申请日:2022-06-21
申请人: 河北省讯飞人工智能研究院 , 科大讯飞股份有限公司 , 科大讯飞(北京)有限公司
IPC分类号: G06F40/166 , G06F40/289 , G06F40/30
摘要: 本发明提供一种文本改写方法、装置、电子设备和存储介质,所述方法包括:获取第一文本;将目标改写等级以及第一文本输入至文本改写模型,得到文本改写模型输出的与目标改写等级对应的第二文本;文本改写模型基于第一样本文本、第二样本文本以及样本改写等级训练得到,样本改写等级基于第一样本文本与第二样本文本之间的字符相似度确定。本发明提供的文本改写方法、装置、电子设备和存储介质,基于第一样本文本、第二样本文本以及样本改写等级训练得到文本改写模型,使得文本改写模型能够根据不同目标改写等级对第一文本进行文本改写,得到与不同目标改写等级对应的第二文本,实现能够根据不同场景需求灵活变更改写文本。
-
公开(公告)号:CN118585749A
公开(公告)日:2024-09-03
申请号:CN202410656447.8
申请日:2024-05-24
申请人: 科大讯飞(北京)有限公司 , 科大讯飞股份有限公司 , 河北省讯飞人工智能研究院
IPC分类号: G06F18/10 , G06F18/214 , G06F40/232
摘要: 本申请公开了一种训练文本获取方法、装置、设备和存储介质,该方法包括:获取用第一语种表达的第一文本集,并确定所述第一文本集中各第一文本所属的目标类别;利用各所述目标类别对应的清洗方式清洗属于各所述目标类别的第一文本,得到用所述第一语种表达的目标文本集,所述目标文本集中的目标文本用于作为目标文本纠错模型的训练文本。通过上述方式,本申请能够提高训练文本的质量,进而能够缩短目标文本纠错模型的训练时间。
-
-
-
-
-
-
-
-
-