发明公开
- 专利标题: 媒资多标签分类纠正方法及装置
-
申请号: CN202311538939.9申请日: 2023-11-17
-
公开(公告)号: CN118797049A公开(公告)日: 2024-10-18
- 发明人: 宋冬冬 , 肖亮 , 蒋健 , 严昱超 , 彭庆 , 丛鹏宇
- 申请人: 中国移动通信集团浙江有限公司 , 中国移动(浙江)创新研究院有限公司 , 中国移动通信集团有限公司
- 申请人地址: 浙江省杭州市解放东路19号; ;
- 专利权人: 中国移动通信集团浙江有限公司,中国移动(浙江)创新研究院有限公司,中国移动通信集团有限公司
- 当前专利权人: 中国移动通信集团浙江有限公司,中国移动(浙江)创新研究院有限公司,中国移动通信集团有限公司
- 当前专利权人地址: 浙江省杭州市解放东路19号; ;
- 代理机构: 北京国昊天诚知识产权代理有限公司
- 代理商 朱文杰
- 主分类号: G06F16/35
- IPC分类号: G06F16/35
摘要:
本申请公开了一种媒资多标签分类纠正方法及装置。所述方法包括:获取待打标媒资数据;通过词向量模型对待打标的媒资数据进行第一处理,得到第一向量;将第一向量输入到预训练的媒资多标签分类模型中,得到第一预测结果;第一预测结果为多个第一标签和多个第一标签中每个第一标签的概率;基于第一预测结果,对待打标媒资数据打标,得到第一打标媒资数据;基于预训练的相似度模型和第一媒资库中的第二标签,获取第二媒资数据并进行纠正处理,得到第二打标媒资数据;第二媒资数据为第三媒资数据中外网标签与第二标签的相似度达到预设值的媒资数据,第三媒资数据为外网打标的媒资数据;基于第一打标媒资数据和第二打标媒资数据,更新第一媒资库。