-
公开(公告)号:CN110838286B
公开(公告)日:2024-05-03
申请号:CN201911137419.0
申请日:2019-11-19
申请人: 腾讯科技(深圳)有限公司 , 昆山杜克大学
摘要: 本申请公开了一种模型训练的方法,包括:获取第一语音数据样本集合,第一语音数据样本具有已标注的真实语种标签;根据第一语音数据样本集合生成第二语音数据样本集合,第二语音数据样本为第一语音数据样本经过基频随机变换后得到的;根据第二语音数据样本集合以及伴奏数据样本集合,生成音频数据样本集合;基于音频数据样本集合,通过待训练语种识别模型获取预测语种标签;基于真实语种标签以及预测语种标签,采用损失函数对待训练语种识别模型进行训练,得到语种识别模型。本申请还公开了一种语种识别的方法及装置。本申请可以实现零资源条件下的模型训练,提升模型训练效果,增强了语种识别的准确度和可靠性。
-
公开(公告)号:CN112449231B
公开(公告)日:2023-02-03
申请号:CN201910817647.6
申请日:2019-08-30
申请人: 腾讯科技(深圳)有限公司
IPC分类号: H04N21/431 , H04N21/439 , H04N21/44 , H04N21/4402 , H04N21/472
摘要: 本发明提供了一种多媒体文件素材的处理方法、装置、电子设备及存储介质;方法包括:响应于针对视频素材添加音频素材的编辑操作,在音频素材库页面中呈现候选的音频素材;响应于针对候选的音频素材的选择操作,在音频素材库页面的预览框中,呈现视频素材与所述选择操作的目标音频素材的合成效果;响应于针对预览框中的音频素材剪辑入口的触发操作,从音频素材库页面切换到预览页面,并在预览页面中呈现音频素材剪辑组件;通过音频素材剪辑组件从目标音频素材中剪辑与视频素材的时长匹配的音频素材片段,在预览页面中呈现视频素材与被剪辑的音频素材片段的合成效果。通过本发明,能够提升视频素材的编辑效率和质量。
-
公开(公告)号:CN111901658B
公开(公告)日:2022-07-22
申请号:CN201910371248.1
申请日:2019-05-06
申请人: 腾讯科技(深圳)有限公司
IPC分类号: H04N21/431 , H04N21/488
摘要: 本发明公开了一种评论信息显示方法、装置、终端及存储介质,属于多媒体技术领域。所述方法包括:获取目标视频的目标评论信息;根据对所述目标评论信息的设置操作,确定所述目标评论信息在所述目标视频中的第一显示位置和第一播放时间段;在所述目标视频的所述第一播放时间段内,在所述第一显示位置上,显示所述目标评论信息。本发明通过根据设置操作,来确定该评论信息在视频中的显示位置和播放时间段,确定后即可在视频的播放时间段内在设置的显示位置上显示评论信息,这样将评论信息与视频内容密切联系在一起,关联性强,可以更准确地表达用户的观点,因而,这种显示方式可以有效提高评论信息的准确性和显示效率,显示效果好。
-
公开(公告)号:CN113209641A
公开(公告)日:2021-08-06
申请号:CN202010081767.7
申请日:2020-02-06
申请人: 腾讯科技(深圳)有限公司
IPC分类号: A63F13/87
摘要: 本申请公开了一种信息的交互方法、装置以及计算机可读介质,该方法通过接收游戏端发送的发帖请求;其中,发帖请求中携带有用户的认证账号、以及用户的发帖信息;将发帖请求发送至论坛端;接收论坛端发送的发帖提示信息;其中,发帖提示信息用于说明论坛端已成功利用用户的认证账号,发布与用户的发帖信息相对应的帖子;向游戏端发送发帖提示信息。由于本申请中将发帖请求发送至论坛端,因此论坛端可根据游戏端的发帖请求进行对应的发帖操作,并生成发帖提示信息,将发帖提示信息发送给游戏端,告知已成功发帖。因此用户只需在游戏端中执行发帖操作,即可在论坛端中成功发帖,提升了游戏端与论坛端间的交互性。
-
公开(公告)号:CN110853617A
公开(公告)日:2020-02-28
申请号:CN201911136295.4
申请日:2019-11-19
申请人: 腾讯科技(深圳)有限公司 , 昆山杜克大学
摘要: 本申请公开了一种模型训练的方法,包括:获取音频样本集合以及随机音频样本集合;通过待训练网络模型中的待训练音频生成模型获取第一音频声学特征集合;通过待训练网络模型中的待训练音频生成模型获取第二音频声学特征集合;基于第一音频声学特征集合以及第二音频声学特征集合,通过待训练网络模型中的待训练音频生成模型获取判别结果;基于第二音频声学特征集合,通过待训练网络模型中的待训练语种识别模型获取预测语种标签;采用目标损失函数对待训练网络模型进行训练,得到目标网络模型。本申请还公开了一种语种识别的方法及装置。本申请可以实现低资源条件下的模型训练,提升模型训练效果,增强了语种识别的准确度和可靠性。
-
公开(公告)号:CN104424270A
公开(公告)日:2015-03-18
申请号:CN201310385202.8
申请日:2013-08-29
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F17/30
摘要: 本发明提出一种图片展示的方法及装置,其方法包括:监测用户对移动终端的操作;判断接收到的用户操作是否为特定的操作;当接收到的用户操作为特定的操作时,获取存储在特定存储位置的图片,所述特定存储位置用于自动保存由于用户满意而执行过预设操作的图片;展示获取的所述图片。本发明可以通过预设操作的设定自动化地整理用户满意的图片,并且利用对移动终端特定的操作,快速、便捷地调取出特定存储位置的图片进行展示,操作方便,大大节约了从移动终端的相册中翻阅大量图片所花费的时间成本。
-
公开(公告)号:CN116775980A
公开(公告)日:2023-09-19
申请号:CN202210222089.0
申请日:2022-03-07
申请人: 腾讯科技(深圳)有限公司
IPC分类号: G06F16/9532 , G06F18/22 , G06F18/25
摘要: 本申请实施例公开了一种跨模态搜索方法及相关设备,该跨模态搜索方法包括:获取第一模态数据;基于第一模态数据的内容信息在第二模态数据库中进行搜索,得到第一集合,该第一集合中包含与第一模态数据的内容信息相匹配的一个或多个第二模态数据;基于第一模态数据的语义信息在第二模态数据库中进行搜索,得到第二集合,该第二集合中包含与第一模态数据的语义信息相匹配的一个或多个第二模态数据;对第一集合和第二集合进行合并,得到第一模态数据对应的跨模态搜索结果。通过本申请实施例,可以提升跨模态搜索的效率,以及跨模态搜索结果的多样性和全面性。
-
公开(公告)号:CN110853618B
公开(公告)日:2022-08-19
申请号:CN201911137417.1
申请日:2019-11-19
申请人: 腾讯科技(深圳)有限公司 , 昆山杜克大学
IPC分类号: G10L15/00 , G10L15/02 , G10L15/06 , G10L15/16 , G10L21/0272 , G10L21/0308 , G10L25/18 , G10L25/30
摘要: 本申请公开了一种语种识别的方法,包括:获取待识别音频数据;从所述待识别音频数据提取音频频域特征;基于所述音频频域特征,对所述待识别音频数据进行声伴数据分离,得到待识别语音数据,其中,所述声伴数据分离为从音频数据中分离出语音数据和伴奏数据;对所述待识别语音数据进行语种识别,得到所述待识别音频数据的语种识别结果。本申请还公开了一种模型训练的方法、装置及设备。本申请在语种识别模型中仅输入待识别语音数据,去除伴奏音乐的部分,从而减少了伴奏音乐对语种识别的干扰,从而提升了歌曲语种识别的准确度。
-
公开(公告)号:CN110691028B
公开(公告)日:2022-07-08
申请号:CN201910873020.2
申请日:2019-09-16
申请人: 腾讯科技(深圳)有限公司
IPC分类号: H04L51/04
摘要: 本申请实施例公开了一种消息处理方法、装置、终端和存储介质,其中,本申请实施例可以显示即时通讯会话页面,通讯会话页面包括用户发送的即时通讯消息,即时通讯消息包括文本内容;当检测到针对所述即时通讯消息的触发操作时,显示分词控件;基于用户针对所述分词控件的触发操作,显示词单元详情页面,其中,所述词单元详情页面包括词单元,所述词单元为所述文本内容经过分词处理后得到的词单元,所述词单元被设置为:允许被用户操作以选中所述词单元。通过对文本内容进行划分得到词单元,可以准确、高效地对通讯消息中的部分文本内容进行选择。
-
公开(公告)号:CN111064795B
公开(公告)日:2021-05-14
申请号:CN201911323641.X
申请日:2019-12-20
申请人: 腾讯科技(深圳)有限公司
摘要: 本公开提供了一种网页访问加速方法、系统、计算机设备、服务器及介质,属于互联网技术领域。所述方法包括:当接收到对目标客户端的启动指令时,启动目标客户端,通过目标客户端上配置的目标域名,向目标服务器发送访问目标域名对应的地址的网页访问请求,目标服务器通过目标通信链路向代理服务器发送该网页访问请求,代理服务器对该网页访问请求的目标网址进行检测,当目标网址包括目标域名时,则获取网页数据并发送至终端,终端通过目标客户端对接收到的网页数据进行显示。本公开通过终端、目标服务器和代理服务器之间的通信,即可以实现目标网址对应的网页数据的获取,成本较低,并且目标通信链路的信息传输速度较快,加速效果提高。
-
-
-
-
-
-
-
-
-