-
公开(公告)号:CN118797149A
公开(公告)日:2024-10-18
申请号:CN202410486437.4
申请日:2024-04-22
IPC分类号: G06F16/9535 , G06F16/335 , G06F16/33 , G06N20/00 , G06F40/284 , G06N3/0499 , G06N3/0895
摘要: 本申请公开了一种内容推荐方法、电子设备和计算机可读存储介质,属于通信领域。所述内容推荐方法包括:获取终端传输的目标推荐任务;从所述目标深度学习模型获取所述目标推荐任务的目标文本嵌入信息;所述目标深度学习模型用于内容语义理解;从目标推荐系统中获取所述目标推荐任务的目标标识嵌入信息,所述目标标识嵌入信息用于提高目标深度学习模型对目标对象表征的唯一性指代理解,所述目标对象包括用户和物品中的至少一种;将所述目标标识嵌入信息和所述目标文本嵌入信息合并,得到所述目标推荐任务的整体嵌入特征;通过所述目标深度学习模型中的大语言模型主体对所述整体嵌入特征进行处理,得到目标处理结果,所述目标处理结果用于内容推荐。
-
公开(公告)号:CN118735182A
公开(公告)日:2024-10-01
申请号:CN202410790878.3
申请日:2024-06-19
申请人: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06Q10/0631 , G06Q10/0637 , G06F40/151 , G06F40/30
摘要: 本申请涉及人工智能技术领域,提供一种机器人调用方法、装置、电子设备、存储介质及程序产品,方法包括响应于用户指令,基于语义向量、关键词和预测指令中的至少一个对用户指令和预先定义的机器人的应用描述进行匹配,确定机器人候选列表;根据用户指令和机器人候选列表,确定至少一提示词;输入提示词至预先确定的大模型,大模型用于确定与用户指令对应的参数信息,基于提示词从机器人候选列表中选取至少一目标机器人;根据参数信息,调用目标机器人。本申请采用先基于用户指令进行检索,再利用大模型识别的方式来获取目标机器人,无需用户准确记忆格式化指令,降低用户指令中噪声,有效增加了目标机器人的识别准确率。
-
公开(公告)号:CN118866008A
公开(公告)日:2024-10-29
申请号:CN202410936570.5
申请日:2024-07-12
摘要: 本申请涉及计算机领域,提供一种异常语音识别方法、装置、设备、介质及产品。该方法包括:基于调优后的自动语音识别模型将待识别语音转换为文本;在文本的文本困惑度大于预设阈值时,基于文本修正模型对文本进行修正得到修正文本;将修正文本输入至异常语义识别模型中,得到待识别语音的识别结果;识别结果包括待识别语音是否异常和/或待识别语音的异常类型;自动语音识别模型是基于在异常文本中确定的异常词汇进行调优的。本申请通过调优后的自动语音识别模型进行文本转换,提高了文本转换的准确度;通过将低质量文本进行修正后再输入异常语义识别模型中,可以使异常语义识别模型更易识别异常文本,提高了异常语音识别的准确度。
-
公开(公告)号:CN118823316A
公开(公告)日:2024-10-22
申请号:CN202410921119.6
申请日:2024-07-10
申请人: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司
IPC分类号: G06V10/25 , G06V20/70 , G06V10/40 , G06V10/764 , G06V10/82
摘要: 本申请实施例提供了一种目标检测方法、装置、电子设备和存储介质,该目标检测方法包括:获取目标图像,目标图像包括待检测的第一目标对象;将目标图像输入至检测模型;通过检测模型的提示编码模块从目标图像中提取第一目标对象的第一图像语义信息,第一图像语义信息用于对第一目标对象进行描述;通过检测模型的图像编码模块提取目标图像的第一图像特征;将第一图像语义信息和第一图像特征输入至检测模型的检测模块进行目标检测,输出第一目标对象所属的类别。
-
公开(公告)号:CN118798293A
公开(公告)日:2024-10-18
申请号:CN202311394640.0
申请日:2023-10-25
申请人: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06N3/082 , G06N3/0455
摘要: 本发明提供一种基于多任务辅助的神经网络通道剪枝方法及装置,方法包括:确定骨干网络的任务内容,所述任务内容包括主任务和辅助任务;构造和初始化所述骨干网络的编码向量,所述编码向量至少包括:当前层网络的第一编码向量和上一层网络的第二编码向量;对所述编码向量增加L1系数正则化约束,得到约束结果,将所述编码向量作为所述当前层网络的句柄,将所述句柄结合所述约束结果对所述当前层网络进行所述编码向量对应通道的剪枝;将所述第一编码向量和第二编码向量输入至已构建的权重生成网络中进行训练和网络结构修剪,得到训练完成的剪枝网络。本发明能够提升主任务精度和进一步增强网络的泛化能力。
-
公开(公告)号:CN118798283A
公开(公告)日:2024-10-18
申请号:CN202311782784.3
申请日:2023-12-22
申请人: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
摘要: 本申请公开了一种模型训练加速方法和装置,该模型训练加速方法包括:在模型训练过程中,对梯度变化率低于冻结阈值的网络层进行冻结,所述冻结用于使得所述网络层停止反向传播;根据衰减系数对所述冻结阈值进行衰减处理,得到衰减冻结阈值;利用未冻结的网络层进行模型训练,对梯度变化率低于所述衰减冻结阈值的网络层进行冻结,直至所述模型训练达到预设精度或预设次数为止。本申请实施例在模型训练过程中逐渐冻结部分网络层,以停止反向传播,有效减少了显存占用提升运算效率,提升训练速度,同时对冻结阈值进行衰减处理,避免提前将未训练收敛的网络层冻结的情况发生。
-
公开(公告)号:CN118798134A
公开(公告)日:2024-10-18
申请号:CN202410409906.2
申请日:2024-04-07
IPC分类号: G06F40/16 , G06F40/284 , G06N20/00 , G06F16/38
摘要: 本申请公开了一种内容生成方法、装置、电子设备和可读存储介质,属于计算机领域。包括:获取目标文本,目标文本包括用于指示内容生成的关键词;向人工智能生成内容模型输入目标文本;通过人工智能生成内容模型得到与目标文本相匹配的目标生成内容;其中,在通过人工智能生成内容模型得到目标生成内容的过程中,人工智能生成内容模型基于第一向量和第二向量,生成目标结果,目标结果用于得到目标生成内容;第一向量为人工智能生成内容模型基于所述目标文本生成的向量,第二向量为从向量数据库中获取的与目标文本相关联的向量,向量数据库获取所述第二向量的时间比获取用于训练人工智能生成内容模型的历史数据的时间更晚。
-
公开(公告)号:CN118796505A
公开(公告)日:2024-10-18
申请号:CN202410695325.X
申请日:2024-05-31
申请人: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
摘要: 本发明提供一种基于大语言模型的业务处理方法及装置,其中方法包括:基于算力网络接收目标业务请求;算力网络基于预先存储的业务请求与适配器之间映射关系,从多个适配器中确定目标业务请求对应的目标适配器;算力网络基于基座大语言模型以及目标适配器,构建目标业务请求的目标推理服务,并基于目标推理服务,处理目标业务请求。本发明提供的基于大语言模型的业务处理方法及装置,通过算力网络仅需要部署一个完整基座大语言模型,基于多个适配器之间的切换即可完成推理能力的切换,显著节省算力资源,使得不同类型的适配器可以在同一推理任务中协同工作,大幅度提高处理效率。
-
公开(公告)号:CN118708339A
公开(公告)日:2024-09-27
申请号:CN202410766522.6
申请日:2024-06-14
摘要: 本发明提供一种多模态语言模型的部署方法、装置、设备、介质和产品,属于人工智能技术领域,该方法包括:对编码器簇集合中的任一编码器簇、映射器簇集合中的任一映射器簇以及生成式语言模型集合中的任一生成式语言模型进行动态组合;对于任一多模态推理任务,从所有组合中选择任一符合需求约束的组合构成多模态语言模型,对多模态语言模型进行部署,以执行多模态推理任务。本发明通过编码器簇、映射器簇和生成式语言模型的动态组合构建多模态语言模型执行多模态推理任务,且编码器簇之间可复用部分编码器,映射器簇之间可复用部分映射器,使得各个计算性能高的模块被充分复用,以节约计算性能高的模块所占用的冗余算力、内存等资源。
-
公开(公告)号:CN118568785A
公开(公告)日:2024-08-30
申请号:CN202410623729.8
申请日:2024-05-20
申请人: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F21/64 , G06F18/241 , G06F18/213 , G06F18/214
摘要: 本发明提供一种文档检测方法、系统、设备及介质,涉及数据处理技术领域,该方法包括:将待检测文档输入至文档检测模型的输入层,得到所述输入层输出的所述待检测文档的多层次的嵌入特征;将多层次的所述嵌入特征输入至所述文档检测模型的检测层,得到所述检测层输出的所述待检测文档的文本特征;将所述文本特征输入至所述文档检测模型的输出层,得到所述输出层对所述文本特征进行多层次的降维变换操作和分类操作输出的所述待检测文档的完整性检测结果;其中,所述文档检测模型是在预训练的BERT‑Large模型的基础上,基于样本文档和所述样本文档的完整性标签进行训练得到的。本发明实现自动、高效、精准地进行文档检测。
-
-
-
-
-
-
-
-
-