-
公开(公告)号:CN116150312A
公开(公告)日:2023-05-23
申请号:CN202211016936.4
申请日:2022-08-24
申请人: 马上消费金融股份有限公司
IPC分类号: G06F16/33 , G06F16/35 , G06F18/214 , G06F18/241
摘要: 本公开关于一种文本情感分类方法、模型的训练方法和应答方法。该情感预测方法包括:获取待处理文本;基于待处理文本中的情感词,得到第一文本,其中,第一文本中包括待处理文本中的情感词以及情感词对应的标注情感类别;将待处理文本和第一文本输入到情感分类模型,得到待处理文本的情感分类结果,情感分类结果用于表征待处理文本的情感倾向。
-
公开(公告)号:CN114896365A
公开(公告)日:2022-08-12
申请号:CN202210451687.5
申请日:2022-04-27
申请人: 马上消费金融股份有限公司
IPC分类号: G06F16/33 , G06F40/211 , G06N3/04 , G06N3/08
摘要: 本申请公开一种模型训练方法、情感倾向预测方法和装置,用于提高情感倾向的预测准确率。本方案包括:基于多个第一样本数据和所述多个样本数据对应的情感倾向标签,对情感倾向预测模型进行第一训练;在所述第一训练之后,基于多个第二样本数据和所述多个第二样本数据对应的情感倾向标签,对所述第一训练后的情感倾向预测模型进行第二训练,其中,所述第二样本数据的粒度大于所述第一样本数据的粒度。
-
公开(公告)号:CN114880430A
公开(公告)日:2022-08-09
申请号:CN202210502398.3
申请日:2022-05-10
申请人: 马上消费金融股份有限公司
IPC分类号: G06F16/33 , G06F16/335 , G06F40/30 , G06K9/62
摘要: 本申请实施例提供了名称处理方法及装置,在获取到目标对象的第一非标准名称后,对第一非标准名称进行简化处理,得到第二非标准名称;以及对待简化标准名称集中的标准名称进行简化处理,得到简化标准名称集;然后确定简化标准名称集中与第二非标准名称相匹配的目标简化标准名称,目标简化标准名称对应的未简化标准名称即可作为第一非标准名称的参考标准名称,以使得在用户输入不规范的名称时,从预设标准名称集中自动匹配该不规范名称对应的参考标准名称,这样能够提高针对不规范名称进行标准名称匹配的效率和匹配准确度,并且还可以根据该参考标准名称对不规范名称进行纠正或者根据该参考标准名称确定输入不规范名称的用户是否为目标服务用户。
-
公开(公告)号:CN114817501A
公开(公告)日:2022-07-29
申请号:CN202210452946.6
申请日:2022-04-27
申请人: 马上消费金融股份有限公司
IPC分类号: G06F16/332 , G06F40/30 , G06K9/62
摘要: 本发明提供一种数据处理方法、数据处理装置及电子设备。方法包括:获取目标交互场景对应的微调训练样本集,微调训练样本集包括微调训练样本和微调训练样本对应的意图标签。通过意图识别模型中第一模块对所述微调训练样本进行语义编码,通过意图识别模型中的第二模块对语义编码结果进行意图预测,得到微调训练样本对应的意图预测结果,第一模块是基于目标交互场景的关联场景中历史对话数据对和单头注意力机制进行无监督预训练得到的。基于微调训练样本的意图标签和微调训练样本的意图预测结果对第二模块进行微调训练。本发明能够快速完成用于意图识别模型的训练,并减小对于标注样本的依赖,特别适用于冷启动和小样本支持的应用场景。
-
公开(公告)号:CN114330882A
公开(公告)日:2022-04-12
申请号:CN202111639430.4
申请日:2021-12-29
申请人: 马上消费金融股份有限公司
摘要: 本申请公开了一种数据处理方法,包括:服务器将预设模型分发至每个计算机设备,计算机设备接收从服务器发送的预设模型,以及对预设模型进行训练得到本地参数数据。进而计算机设备将本地参数数据发送至服务器,服务器根据参数奖惩规则确定每个本地参数数据对应的更新参数数据,并将每个更新参数数据发送至对应的计算机设备,计算机设备根据更新参数数据对预设模型进行迭代训练,直至预设模型满足预设条件得到目标预测模型,进而基于目标预测模型对用户进行意图预测得到意图预测结果。本方法能够联合多个参与方共同训练意图预测模型,提高企业对具有投诉意图的用户的预测准确率,降低用户投诉的频率。
-
公开(公告)号:CN113450757A
公开(公告)日:2021-09-28
申请号:CN202110712369.5
申请日:2021-06-25
申请人: 马上消费金融股份有限公司
摘要: 本申请公开了一种语音合成方法、装置、电子设备及计算机可读存储介质。该方法包括:将第一文本数据转换为第二文本数据,第一文本数据为第一语种对应的文本数据,第二文本数据为第二语种对应的文本数据,第二语种的资源少于第一语种的资源;将第二文本数据输入预先训练的语音生成模型进行语音合成,得到第二语种对应的语音数据;其中,语音生成模型用于对第二文本数据所对应的语音序列中的音素进行音素替换,并根据音素替换后的目标语音序列合成第二语种对应的语音数据。这样,可以避免通过人工收集的方式获取第二语种对应的文本数据和语音数据,使得低资源语种的数据采集周期变短,且数据质量提高。
-
公开(公告)号:CN111143571B
公开(公告)日:2020-12-25
申请号:CN201811314682.8
申请日:2018-11-06
申请人: 马上消费金融股份有限公司
IPC分类号: G06F16/36
摘要: 本申请公开了一种实体标注模型的训练方法、实体标注方法以及装置,训练方法包括:将已标注语料以及目标领域的未标注语料输入到深度序列模型;通过深度序列模型根据已标注语料的实体类型对目标领域的未标注语料进行实体类型的标注,得到目标领域的未标注语料的标注实体类型;通过深度序列模型对目标领域的未标注语料进行实体类型预测,得到目标领域的未标注语料的预测实体类型;将标注实体类型与预测实体类型进行比对,根据比对结果确定对深度序列模型是否进行再训练,并得到实体标注模型,实体标注模型为训练完成的深度序列模型。通过上述方式,能够在不需要大量人工标注语料的前提下,实现不同领域的无监督实体标注。
-
-
-
-
-
-