-
公开(公告)号:CN118798282A
公开(公告)日:2024-10-18
申请号:CN202311231206.0
申请日:2023-09-22
申请人: 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司
IPC分类号: G06N3/063 , G06N3/0455 , G06N3/0464 , G06N3/08
摘要: 本申请涉及数据处理技术领域,提供一种单个GPU的模型训练方法、装置、电子设备及存储介质。方法包括:对待训练模型的多个网络层进行划分,得到块结构Block,并将Block依次输入GPU中进行训练;基于网络层的梯度相对变化率,确定Block中已收敛的网络层和未收敛的网络层;冻结已收敛的网络层,并对未收敛的网络层进行迭代训练,直至所有未收敛的网络层收敛。本申请通过划分Block进行大模型训练,降低了大模型训练对GPU显存的占用,同时,通过未冻结网络层的梯度相对变化率进行自适应冻结,实现动态冻结,从而减少了模型训练的计算量和训练时间,有效的提高了对大模型训练的效率。
-
公开(公告)号:CN118797098A
公开(公告)日:2024-10-18
申请号:CN202410688238.1
申请日:2024-05-30
申请人: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F16/735 , G06F16/738 , G06F18/213 , G06F18/214 , G06F18/22 , G06F18/25 , G06N3/045 , G06N3/08
摘要: 本发明提供一种视频排序推荐方法、装置、电子设备、存储介质及产品,包括:获取目标用户的各交互行为对应的行为序列和目标用户对应的多个候选视频的播放特征;将各交互行为对应的行为序列输入训练好的双塔模型中的用户塔模型进行特征提取,得到目标用户的交互行为特征;用户塔模型包括融合掩码机制与阈值门控机制的多头自注意力模块,多头自注意力模块用于排除行为序列中不相关元素的注意力权重计算;根据各个候选视频的播放特征与交互行为特征之间的相关性,确定针对目标用户的推荐视频。本发明通过融合了掩码机制与阈值门控机制的多头自注意力模块,可以避免引入不相关的干扰信息,提高视频粗排推荐的准确性,提高视频推荐效果。
-
公开(公告)号:CN118797049A
公开(公告)日:2024-10-18
申请号:CN202311538939.9
申请日:2023-11-17
申请人: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F16/35
摘要: 本申请公开了一种媒资多标签分类纠正方法及装置。所述方法包括:获取待打标媒资数据;通过词向量模型对待打标的媒资数据进行第一处理,得到第一向量;将第一向量输入到预训练的媒资多标签分类模型中,得到第一预测结果;第一预测结果为多个第一标签和多个第一标签中每个第一标签的概率;基于第一预测结果,对待打标媒资数据打标,得到第一打标媒资数据;基于预训练的相似度模型和第一媒资库中的第二标签,获取第二媒资数据并进行纠正处理,得到第二打标媒资数据;第二媒资数据为第三媒资数据中外网标签与第二标签的相似度达到预设值的媒资数据,第三媒资数据为外网打标的媒资数据;基于第一打标媒资数据和第二打标媒资数据,更新第一媒资库。
-
公开(公告)号:CN118796451A
公开(公告)日:2024-10-18
申请号:CN202410669317.8
申请日:2024-05-28
申请人: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司 , 中国移动(浙江)创新研究院有限公司
IPC分类号: G06F9/50
摘要: 本发明提供一种算力重构配置方法及装置,其中方法包括:对本地系统集群中的所有待启动业务进行算力分析,确定整体并行算力值;在第一算力冗余小于整体并行算力值的情况下,已启动业务的业务属性,对已启动业务进行本地算力重构,确定第二算力冗余;在第二算力冗余小于整体并行算力值的情况下,调用边缘计算资源进行二次算力重构,使得二次算力重构后的算力冗余大于等于所述整体并行算力值。本发明提供的算力重构配置方法及装置,通过基于本地系统集群中已启动业务进行算力重构,提升本地算力利用率。并进一步引入边缘计算资源对待启动业务进行二次算力重构,达到满足本地系统集群的驱动需求,提升本地算力利用率。
-
公开(公告)号:CN118796194A
公开(公告)日:2024-10-18
申请号:CN202311688263.1
申请日:2023-12-07
申请人: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F8/41 , G06N3/045 , G06N3/09 , G06F18/214 , G06F40/232 , G06F40/253 , G06F40/30
摘要: 本申请公开了一种语句纠错模型的训练方法、语句纠错方法及装置,该语句纠错模型的训练方法包括:基于历史SQL语句的SQL日志数据,采集样本数据,样本数据包括正样本集合和正负样本集合;利用正负样本集合中的数据,对BERT预训练模型进行训练,得到BERT分类模型,BERT分类模型用于对待纠错的SQL语句进行分类检测,以确定SQL语句的正确性;在正样本集合中的数据中添加基于预设噪声函数确定的噪声,得到重构文本数据;利用BART算法框架对重构文本数据进行训练,得到BART预训练语言模型;利用正负样本集合中的数据,对BART预训练语言模型进行训练,得到BART纠错模型,BART纠错模型用于对BERT分类模型确定出的错误的SQL语句进行改写纠错。
-
公开(公告)号:CN118796165A
公开(公告)日:2024-10-18
申请号:CN202311697982.X
申请日:2023-12-11
申请人: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
IPC分类号: G06F8/30 , G06F8/71 , G06F18/214
摘要: 本发明提供模型分布式迁移代码生成方法、装置、设备及介质,其中方法包括:获取配置文件,基于配置文件确定目标操作模式;当目标操作模式为模型训练模式时,对配置文件进行解析,得到第一模型迁移配置参数;读取待迁移模型的训练源代码,基于第一模型迁移配置参数和训练源代码,生成待迁移模型的分布式训练程序代码。本发明可以自动生成大模型迁移至分布式框架下训练的代码,提高模型迁移到分布式框架的效率。
-
公开(公告)号:CN113542142A
公开(公告)日:2021-10-22
申请号:CN202010291382.3
申请日:2020-04-14
申请人: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司
IPC分类号: H04L12/801 , H04L12/803 , H04L12/807 , H04L12/931 , G06K9/00 , G06K9/62
摘要: 本发明实施例涉及图像处理技术领域,公开了一种人像防伪检测方法、装置及计算设备,该方法包括:获取图像并进行预处理;在所述图像的频域或颜色空间上提取特征,并检测所述图像是否进行了P图;对所述图像进行复杂场景和背景干扰检测,确定所述图像是否为翻拍图像;利用区域搜索匹配方式检测所述图像是否为一图多用。通过上述方式,本发明实施例能够极大提升了人像防伪检测的准确性,能够覆盖95%以上的造假场景,检测实时性高。
-
公开(公告)号:CN112307817B
公开(公告)日:2024-03-19
申请号:CN201910688392.8
申请日:2019-07-29
申请人: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司
摘要: 本发明实施例涉及图像处理技术领域,公开了一种人脸活体检测方法、装置、计算设备及计算机存储介质,该方法包括:采集用于用户人脸识别的视频图像;根据所述视频图像截取用于人脸识别的连续各帧图像;对所述连续各帧图像进行图片压缩形成图片流并传输至服务端进行识别处理。通过上述方式,本发明实施例通过前后端分离,实现了更可靠的动作指令决定方式,提高了活体检测应用的安全性和实时性。
-
公开(公告)号:CN111258551A
公开(公告)日:2020-06-09
申请号:CN201811458476.4
申请日:2018-11-30
申请人: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司
摘要: 本发明实施例提供一种代码生成方法及装置,所述方法包括:获取输入的任务模型数据;将所述任务模型数据代入预先建立的代码生成器模型进行训练;输出所述任务模型数据对应的代码。利用本发明实施例实现了基于配置化任务模型数据方式同时生成对象bean,数据访问层、业务访问层等,根据任务模型数据生成适配多种不同框架并且可生成多种程序语言的业务代码。
-
公开(公告)号:CN115442656B
公开(公告)日:2023-08-15
申请号:CN202110626961.3
申请日:2021-06-04
申请人: 中国移动通信集团浙江有限公司 , 中国移动通信集团有限公司
IPC分类号: H04N21/44
摘要: 本申请公开了一种视频片头片尾自动检测方法、装置、设备和存储介质,该方法包括:确定目标视频集,从所述目标视频集中选择得到待检测视频片段;对所述待检测视频片段进行预处理,得到预处理视频片段;对所述预处理视频片段进行编码处理,得到编码视频片段;通过预设滑动窗口和投票策略,寻找所述编码视频片段的最长相似子串;根据所述最长相似子串,确定所述待检测视频片段的检测结果。在本申请中,通过寻找最长相似子串的方式,对影视剧类片头片尾进行智能化打点即进行智能化识别,从而得到精准得到影视剧片头片尾位置信息,提升电视剧类影视作品的用户使用效率。
-
-
-
-
-
-
-
-
-