特征数据的生成方法、装置、计算机设备和存储介质

    公开(公告)号:CN111738848B

    公开(公告)日:2024-03-19

    申请号:CN202010423064.8

    申请日:2020-05-19

    发明人: 侯皓龄

    IPC分类号: G06Q40/04 G06F16/22

    摘要: 本申请涉及一种特征数据的生成方法、装置、计算机设备和存储介质。所述方法包括:获取预设时间段内的交易信息、当前版本的语句配置文件和上一版本的语句配置文件;所述语句配置文件存储在预先设置的版本库,所述语句配置文件中包含特征提取语句的配置信息;根据所述当前版本的语句配置文件和所述上一版本的语句配置文件,确定所述特征提取语句的变更信息;根据所述特征提取语句的变更信息,得到变更后的特征提取语句和未变更的特征提取语句;采用所述变更后的特征提取语句对所述交易信息进行特征提取,得到目标特征数据,并由所述目标特征数据和所述未变更的特征提取语句对应的特征数据组成全量特征数据。采用本方法能够节省计算资源。

    一种模型训练方法及模型训练装置

    公开(公告)号:CN113160041B

    公开(公告)日:2024-02-23

    申请号:CN202110495293.5

    申请日:2021-05-07

    摘要: 本发明实施例公开了一种模型训练方法及训练装置,用于在图像翻译模型的训练数据较少时,提升图像翻译模型的图像翻译质量。本发明实施例方法包括:利用训练数集对图像翻译模型的生成器和判别器做训练,并将训练后的图像翻译模型视为老师模型,训练数集包括目标帧图像、目标帧图像的轮廓线数据、目标帧图像的距离图像数据和目标帧图像的前N帧图像数据;利用训练数集中的第一数据对图像翻译模型的生成器和判别器进行训练,并将训练后的图像翻译模型视为学生模型,第一数据包括目标帧图像、目标帧图像的轮廓线数据和目标帧图像的前M帧图像数据,M为大于等于1且小于等于N的整数;利用老师模型对学生模型进行知识蒸馏,得到知识蒸馏后的学生模型。

    命名实体识别方法、装置、计算机设备和存储介质

    公开(公告)号:CN112926326B

    公开(公告)日:2024-01-19

    申请号:CN202110191377.X

    申请日:2021-02-20

    发明人: 崔健

    IPC分类号: G06F40/295

    摘要: 本申请涉及一种命名实体识别方法、装置、计算机设备和存储介质。所述方法包括:获取待识别的语句,并确定语句对应的业务流程;查询与业务流程对应预设的至少一个召回模板;将语句与至少一个召回模板进行匹配,根据匹配结果确定在语句中与至少一个召回模板匹配成功的待干预语句;通过与业务流程对应预设的干预模板,对待干预语句进行实体识别干预,根据实体识别干预结果获得语句的命名实体识别结果。采用本方法能够提高命名实体识别的准确性。

    人机语音交互测试方法、装置、计算机设备和存储介质

    公开(公告)号:CN113782004B

    公开(公告)日:2023-10-24

    申请号:CN202111091294.X

    申请日:2021-09-17

    发明人: 鲁昱 石真

    IPC分类号: G10L15/01 G10L15/26 G10L17/22

    摘要: 本申请提供了一种人机语音交互测试方法、装置、设备和存储介质。该方法包括:基于与机器人的语音通话对机器人进行第一轮语音交互测试;针对第一轮语音交互测试中产生的用户语音数据,添加对用户语音数据识别的、且与应答相关的标签项;响应于纠正指令,将添加的错误的标签项进行纠正;添加了错误的标签项的用户语音数据为错误应答的用户语音数据;基于错误应答的用户语音数据,对机器人进行语音交互优化;在优化后,基于第一轮测试中的用户语音数据,进行第二轮语音交互测试;将第二轮语音交互测试时机器人针对用户语音数据的应答语句与用户语音数据对应的标签项匹配,根据匹配结果输出第二轮测试的测试结果。本申请的方案能够节省成本。

    呼叫质检方法、装置、计算机设备和计算机可读存储介质

    公开(公告)号:CN111597818B

    公开(公告)日:2023-10-24

    申请号:CN202010275381.X

    申请日:2020-04-09

    发明人: 林道智

    摘要: 本申请涉及一种呼叫质检方法、装置、计算机设备和计算机可读存储介质。所述呼叫质检方法包括:获取已外呼的多个外呼号码分别对应的通话语音数据;对各所述通话语音数据进行语义分析,得到各所述通话语音数据的语义标签;根据各所述通话语音数据的所述语义标签,对各所述通话语音数据进行筛选,并将筛选得到的通话语音数据确定为待质检通话语音数据。采用本方法能够提升呼叫质检的质检效率以及质检准确性。

    信息抽取方法、装置、计算机设备和存储介质

    公开(公告)号:CN111444349B

    公开(公告)日:2023-09-12

    申请号:CN202010150123.9

    申请日:2020-03-06

    IPC分类号: G06F16/36 G06F40/30

    摘要: 本申请涉及一种信息抽取方法、装置、计算机设备和存储介质。所述方法包括:获取目标文本;基于预训练的信息抽取模型提取目标文本的第一字符特征;根据第一字符特征从目标文本中抽取至少一个主语;分别基于抽取出的每个主语重构所述目标文本,得到一个或多个重构文本;提取重构文本的第二字符特征;根据第二字符特征,从每个重构文本中抽取对应主语的关系以及宾语。采用本方法能够提取出文本中的全部三元组信息。

    语句处理方法、装置、计算机设备和存储介质

    公开(公告)号:CN111368554B

    公开(公告)日:2023-07-28

    申请号:CN202010173191.7

    申请日:2020-03-13

    发明人: 张文泽 吴宇凡

    IPC分类号: G06F40/30 G06F16/33

    摘要: 本申请涉及一种语句处理方法、装置、计算机设备和存储介质。所述方法包括:获取待查询语句;对所述待查询语句进行语义特征分析,得到语句语义特征矩阵;获取成语语义特征矩阵;确定所述语句语义特征矩阵和所述成语语义特征矩阵之间的相似度;根据所述相似度输出预设数量个成语。采用本申请的方法能够及时反馈成语结果。

    信息处理方法、装置、电子设备及存储介质

    公开(公告)号:CN111191797B

    公开(公告)日:2023-07-28

    申请号:CN202010006307.8

    申请日:2020-01-03

    发明人: 侯皓龄 刘云峰

    IPC分类号: G06N20/00

    摘要: 本申请实施例提供了一种信息处理方法、装置、电子设备及存储介质,涉及机器学习技术领域。该方法包括:获取评估请求,所述评估请求包括数据集标识和算法标识;获取所述数据集标识对应的目标数据集;基于所述目标数据集,训练所述算法标识对应的待评估算法,得到训练好的待评估模型;获取所述待评估模型的评估结果;通过用户终端输出所述评估结果,以提示所述待评估算法的评估结果。本申请实施例使得用户只需输入数据集标识、算法标识,即可获取算法在该数据集上的评估结果,从而可避免中间人为参与可能带来的误差,同时也可简化评估算法优劣的操作,因此不仅可提高评估准确性和评估结果的参考性,还可减少研发过程的大量重复工作,提高研发效率。

    系统测试方法、装置、电子设备以及存储介质

    公开(公告)号:CN111475409B

    公开(公告)日:2023-06-30

    申请号:CN202010236810.2

    申请日:2020-03-30

    发明人: 马工利

    IPC分类号: G06F11/36

    摘要: 本申请实施例公开一种系统测试方法、装置、电子设备及存储介质。本方法通过获取待测样本数据;继而将文本语句输入到待测试系统,再获取待测试系统召回的与文本语句对应的查询结果的评价参数;若评价参数满足预设阈值,将查询结果作为目标查询结果;若目标查询结果与参考查询结果匹配,判定待测试系统召回准确。实现了在由待测试系统召回的与文本语句对应的查询结果的评价参数满足预设阈值的情况下,将对应的查询结果作为目标查询结果,以便可以在目标查询结果与参考查询结果匹配的情况下,判定待测试系统召回准确,实现了通过单个指标综合评判待测试系统的推荐性能,简化了待测试系统的调参过程。