-
公开(公告)号:CN117194687A
公开(公告)日:2023-12-08
申请号:CN202311101916.1
申请日:2023-08-29
申请人: 百度时代网络技术(北京)有限公司
IPC分类号: G06F16/435 , G06F18/2113
摘要: 本公开提供了一种多媒体推荐方法、装置、设备及存储介质,涉及数据处理领域,尤其涉及人工智能、智能推荐等领域。具体实现方案为:获取M1个第一候选多媒体资源,M1个第一候选多媒体资源是基于N1个目标外域兴趣特征所得的待推荐至目标对象的多媒体资源;目标外域兴趣特征是基于目标对象在源域的行为特征所得;获取M2个第二候选多媒体资源,M2个第二候选多媒体资源是基于N2个目标本域兴趣特征所得的待推荐至目标对象的多媒体资源;目标本域兴趣特征是基于目标对象在目标域的行为特征所得;基于所述M1个第一候选多媒体资源和所述M2个第二候选多媒体资源,得到待推荐至所述目标对象的M3个目标多媒体资源。
-
公开(公告)号:CN116821381B
公开(公告)日:2023-12-01
申请号:CN202311104574.9
申请日:2023-08-30
申请人: 北京科技大学
IPC分类号: G06F16/432 , G06N3/0455 , G06N3/0464 , G06N3/08 , G06F16/435
摘要: 本发明公开了一种基于空间线索的语音‑图像跨模态检索方法及装置,涉及计算机视觉和语音处理技术领域。包括:将语音信号输入到音频编码器,得到空间相关的声学特征;将图像信息输入到图像编码器,得到场景图像特征;对特征进行CSIR,得到跨模态检索结果。本发明通过使用深度学习和相关算法,能够对图像和语音之间的空间关联性进行分析与建模,从而实现图像和语音之间的跨模态检索。与以往的跨模态检索方法只针对语音‑图像的共同语义信息建模不同,本发明重点关注不同模态之间的空间语义一致性,通过深入研究图像和语音之间的空间属性联系,本发明可以帮助用户更高效地检索相关的图像和语音内容,提供更好的交互体验和信息管理
-
公开(公告)号:CN111177425B
公开(公告)日:2023-12-01
申请号:CN201911393095.7
申请日:2019-12-30
申请人: 重庆久远银海软件有限公司
发明人: 赵云
IPC分类号: G16H40/20 , G06F16/438 , G06F16/435 , G06V40/16 , G06V40/10 , G06V20/66
摘要: 一种用于协助公共资源向导的多媒体系统及其工作方法,包括:媒体显示装置、中央控制器、无线通信装置、识别装置、需求录入装置、提示装置;所述识别装置包括特征识别单元与面部识别单元;识别装置通过无线通信装置与中央控制器连接,识别装置向中央控制器共享用户身份;需求录入装置通过无线通信装置与用户终端连接,用户终端向需求录入装置输入用户需求,需求录入装置通过无线通信装置向中央控制器输出用户需求;中央控制器根据用户需求反馈需求导向;所述提示装置接收需求导向,并将需求导向在所述媒体显示装置上显示。
-
公开(公告)号:CN117131275A
公开(公告)日:2023-11-28
申请号:CN202311119782.6
申请日:2023-08-31
申请人: 华中师范大学
IPC分类号: G06F16/9535 , G06F16/435 , G06F16/45 , G06F16/36 , G06N5/022 , G06N5/04 , G06N3/042 , G06N3/0464 , G06N3/045 , G06N3/048 , G06N3/088 , G06F18/22 , G06F18/23 , G06F18/25 , G06Q50/20
摘要: 本申请实施例公开了一种基于知识图谱的学习资源推荐方法,涉及智能教学技术领域,所述方法包括:获取学习者的学习者画像和对应学习者使用的各类学习资源,生成多模态学习资源交互图谱;基于所述多模态学习资源交互图谱,计算对比损失函数;基于学习者与学习资源的交互关系,获取学习者与学习资源的匹配系数;基于所述匹配系数的数值,计算学习者对各类学习资源的兴趣程度;基于所述兴趣程度对各类学习资源进行排序,基于排序结果依次向对应学习者推荐学习资源。采用本申请提供的所述方法,既考虑了学习资源的多模态信息融合,也考虑了学习者的历史学习数据,将二者共同融入学习资源交互网络,丰富了其表达含义,提高了学习资源适配的精准度。
-
公开(公告)号:CN117115505A
公开(公告)日:2023-11-24
申请号:CN202310712211.7
申请日:2023-06-15
申请人: 北京工业大学
IPC分类号: G06V10/764 , G06V10/82 , G06V10/774 , G06F16/435 , G06F40/30 , G06N3/0495 , G06N3/082 , G06N3/0895 , G06N3/0455 , G06N3/0464
摘要: 一种结合知识蒸馏与对比学习的情感增强继续训练方法属于计算机视觉领域。首先利用现有文本情感分类模型及情感字典筛选得到大量具有明显情感倾向的图文对中组成大规模情感图文对数据集;然后应用大规模情感图文对数据集对教师网络进行训练,为了获得泛化性强的教师网络,使用情感自然语言监督方式,同时通过挖掘监督信号中的多粒度情感信息并融入到图片表征中,以增强视觉编码器的情感表达能力;将得到的教师网络视觉模块初始化学生网络同时可以为学生网络提供伪标签数据,并设计任务对学生模型进行针对训练进一步挖掘图片中细节情感信息;将学生网络应用至下游图像情感分类任务。本发明解决进行情感分析模型预测精确度较低以及适用性差的问题。
-
公开(公告)号:CN117097790A
公开(公告)日:2023-11-21
申请号:CN202310996246.8
申请日:2023-08-08
申请人: 北京字跳网络技术有限公司
IPC分类号: H04L67/55 , G06F3/0481 , G06F16/335 , G06F16/35 , G06F16/338 , G06F16/435 , H04M1/72439 , H04M1/72436
摘要: 本公开提供了一种信息推送方法、装置、计算机设备及存储介质,所述方法包括:获取与至少一种播报主题中每种播报主题对应的多个实时多媒体内容;所述多媒体内容对应多种体裁中的至少一种体裁;针对每种播报主题,基于所述每种播报主题对应的多媒体内容生成与所述每种播报主题对应的文本信息;将所述每种播报主题对应的约束条件以及文本信息输入至内容生成模型,得到与所述每种播报主题对应的目标播报内容;响应于满足所述至少一种播报主题中目标播报主题的推送触发条件,向目标用户推送所述目标播报主题下的目标播报内容。
-
公开(公告)号:CN117075732A
公开(公告)日:2023-11-17
申请号:CN202311070868.4
申请日:2023-08-24
申请人: 沨呵智慧科技(上海)有限公司
IPC分类号: G06F3/01 , G06N3/008 , G06F16/332 , G06F16/36 , G06N3/042 , G06N3/045 , G06N5/022 , G06N5/04 , G06F16/435 , G06F16/438 , G06F16/483 , G06V40/16 , G10L15/22 , G10L15/26
摘要: 本发明涉及虚拟数字人技术领域,更具体地说是一种基于LLM语言大模型的虚拟数字人交互系统,本发明交互系统包括:连接单元、图像生成单元、VC语音文字转换单元和表情适配单元,所述表情适配单元包括摄像头,通过用户的表情自动调整相应的虚拟人表情;本发明通过虚拟人能够根据表情适配单元对用户的表情进行分析,然后将表情因素输入到图像生成单元中,图像生成单元根据表情因素然后生成相匹配的单元,进而避免因用户心情不好而加剧用户感受,同时降低用户的不良体验,通过虚拟人配合用户的面部表情能够更加直观的适应当时用户的心情。
-
公开(公告)号:CN117009644A
公开(公告)日:2023-11-07
申请号:CN202211325109.3
申请日:2022-10-27
申请人: 腾讯科技(深圳)有限公司
发明人: 吴航
IPC分类号: G06F16/9535 , G06F16/435 , G06F16/48 , G06F18/241 , G06F18/214 , G06N3/048 , G06N3/08
摘要: 本申请涉及计算机技术领域,尤其涉及一种多媒体信息推荐方法及装置,其中,方法包括:响应于携带有播放对象的对象基础属性和播放条件的播放请求,获取多个候选多媒体信息并提取各自的推荐特征;针对其中一个候选多媒体信息,根据设定信息标识,从对象基础属性、播放条件和一个候选多媒体信息的播放内容中选取至少一个关键信息并提取关键特征;基于关键特征,对一个候选多媒体信息的推荐特征包含的各元素进行权重调整,并基于权重调整结果,获得一个候选多媒体信的预估转化率;直至获得的至少一个预估转化率,从至少一个候选多媒体信息中选取出推荐多媒体信息。上述方法用以提高播放推荐系统推荐多媒体资源的准确性和效率。
-
公开(公告)号:CN117009556A
公开(公告)日:2023-11-07
申请号:CN202211523991.2
申请日:2022-11-30
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F16/435 , G06F16/438 , G06N3/08 , G06N3/0464
摘要: 本申请涉及人工智能技术领域,提供一种基于评估模型的内容推荐方法及相关装置,用以提高评估值的预测准确性,从而提高推荐准确性,其中,评估模型包括元网络模块和预测模块,该方法包括:获取候选媒体内容的属性特征后,将属性特征中的场景特异特征,分别输入至元网络模块的各第一全连接层进行参数预测,获得相应的模型参数集,然后,基于获得的各模型参数集,分别对各第二全连接层进行参数配置,并分别将属性特征输入至各第二全连接层中进行预测,获得相应的评估值,最后,基于评估值进行内容推荐。这样,可以有效地提取出数据源相关的关键信息,使得模型参数可以根据数据源动态进行调整,从而提高了评估值的预测准确性。
-
公开(公告)号:CN116975325A
公开(公告)日:2023-10-31
申请号:CN202310146447.9
申请日:2023-02-13
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F16/435 , G06F16/9535 , G06F18/25
摘要: 本申请实施例公开了一种内容推荐方法、装置、计算机设备和存储介质;本申请实施例可以获取对象的交互内容序列,其中,交互内容序列包括至少一个媒体内容;提取至少一个媒体内容的交互特征和内容特征;确定至少两个内容推荐参考维度;在每个内容推荐参考维度上,根据权重计算方式对媒体内容的交互特征和内容特征进行权重计算处理,得到每个媒体内容在每个内容推荐参考维度上的推荐参考权重;根据媒体内容在每个内容推荐参考维度上的推荐参考权重,对媒体内容进行推荐预测处理,得到每个媒体内容的推荐预测参数;根据每个媒体内容的推荐预测参数对至少一个媒体内容进行推荐处理,可以提高对媒体内容进行推荐的准确性。
-
-
-
-
-
-
-
-
-