-
公开(公告)号:CN112905814B
公开(公告)日:2024-06-18
申请号:CN202110352265.8
申请日:2021-03-31
申请人: 北京大米科技有限公司
发明人: 宋海龙
IPC分类号: G06F16/51 , G06F16/583 , G06F16/955 , G06F16/957
摘要: 本申请实施例公开了一种图片处理的方法、装置、存储介质及电子设备,其中方法应用于基于Thumbor搭建的服务器集群,所述服务器集群对外提供访问接口,包括:获取待处理图片,基于所述待处理图片对应的处理服务确定第一目标访问接口;采用所述第一目标访问接口对应的过滤器对所述待处理图片进行处理。采用本申请,可以基于云服务实现图片处理,提高云服务的智能性和图片处理的便捷性。
-
公开(公告)号:CN113129909B
公开(公告)日:2024-05-03
申请号:CN202110418924.3
申请日:2021-04-19
申请人: 北京大米科技有限公司
发明人: 蒋文斌
IPC分类号: G10L19/008 , G10L19/26 , G06F3/16
摘要: 本申请公开了一种单麦克风语音数据处理方法、装置及计算机存储介质。该方法包括基于单麦克风获取至少两个声道的录制语音数据;将至少两个声道的录制语音数据转换为至少两个声道的数字音频数据;根据至少两个声道的录制语音数据各自对应的音量值得到目标语音数据。对于单麦克风获取的多声道语音数据,可对该多声道的语音数据进行混合得到目标语音数据,避免用户接收的语音数据处于无声或者声音过小,以在保证语音后续处理的快速性的情况下还进一步保证用户的使用体验。
-
公开(公告)号:CN112669417B
公开(公告)日:2024-04-16
申请号:CN202011513783.5
申请日:2020-12-18
申请人: 北京大米科技有限公司
摘要: 本申请公开了一种虚拟形象的生成方法、装置、存储介质及电子设备,属于人工智能技术领域。所述虚拟形象的生成方法包括:获取目标对象的基础虚拟形象视频,确定所述基础虚拟形象视频的头部动作信息,根据所述头部动作信息和所述基础虚拟形象视频生成具有头部动作特性的最终虚拟形象视频。故本申请基于语言情感分类模型生成对应的头部动作信息,进而合成更加自然的增加了头部动作的虚拟形象,提升真实感。
-
公开(公告)号:CN110795913B
公开(公告)日:2024-04-12
申请号:CN201910939618.7
申请日:2019-09-30
申请人: 北京大米科技有限公司
IPC分类号: G06F40/126
摘要: 本申请实施例公开了一种文本编码方法、装置、存储介质及终端,所述方法包括:获取待编码的目标语言文本;将所述目标语言文本输入至预先训练的文本编码模型中,所述文本编码模型基于第一数据样本、第二数据样本以及第三数据样本训练生成,所述第一数据样本与所述第二数据样本的语义相似度大于第一相似度阈值,所述第一数据样本与所述第三数据样本的语义相似度小于第二相似度阈值,所述第一相似度阈值大于或者等于所述第二相似度阈值;输出所述目标语言文本对应的语义向量。因此,采用本申请实施例,利用具有相关性的样本数据训练文本编码模型,训练完成后当使用文本编码模型进行文本编码后输出的向量语义度更加准确。
-
公开(公告)号:CN112650737B
公开(公告)日:2024-03-19
申请号:CN202011627012.9
申请日:2020-12-31
申请人: 北京大米科技有限公司
发明人: 张彪
摘要: 本发明实施例公开了一种数据处理方法、数据处理装置、存储介质和电子设备。本发明实施例确定目标数据库中作为数据存储范围的槽位的槽位信息,并分别根据各槽位的槽位信息确定各槽位的评估值,从而根据各槽位的评估值进行槽位迁移,以平衡至少一个槽位的负载。槽位之间的负载均衡可以使得数据库集群中的各节点负载均衡,因此本发明实施例可以在数据库集群中各数据库之间均衡负载,从而有效降低某一数据库的访问压力。
-
公开(公告)号:CN111915587B
公开(公告)日:2024-02-02
申请号:CN202010753962.X
申请日:2020-07-30
申请人: 北京大米科技有限公司
IPC分类号: G06T7/00 , G06T3/4038 , G06V10/74 , G06V10/774 , G06V10/82 , G06N3/0464 , G06N3/08
摘要: 本发明实施例公开了一种视频处理方法、装置、存储介质和电子设备。本发明实施例在获取待拼接的第一图像序列以及第二图像序列后,确定第一图像序列中的第一图像以及第二图像序列中的第二图像的相似度,并在第一图像与第二图像的相似度满足预定相似度条件时,基于第一模型确定第一图像与第二图像对应的正向光流以及逆向光流,进而基于第二模型确定第一图像与第二图像对应的至少一个目标图像,从而根据目标图像对第一图像序列以及第二图像序列进行拼接处理,获取目标图像序列。本发明实施例基于第一图像以及第二图像得到平滑度较高的至少一个目标图像,从而可以根据目标图像提升两个图像序列之间的平滑度,从而降低视频交替播放过程中的卡顿效果。
-
公开(公告)号:CN111241802B
公开(公告)日:2024-01-30
申请号:CN202010010682.X
申请日:2020-01-06
申请人: 北京大米科技有限公司
IPC分类号: G06F40/186 , G06F16/33 , G06Q50/20
摘要: 本申请实施例公开了一种作业生成方法、装置、存储介质及终端,其中,方法包括:确定至少一个目标教学页面;对所述至少一个目标教学页面所对应的教学内容进行文本分析处理,获取所述教学内容对应的识别结果,所述识别结果包含至少一个语法结构以及至少一个关键词;确定所述至少一个语法结构对应的至少一个语法模板,基于所述至少一个关键词确定至少一个目标词;在题库中检索与所述语法模板和/或目标词相匹配的至少一个目标习题;基于所述至少一个目标习题,生成课后作业。采用本申请实施例,能有效避免课后作业固定单一的问题,并能够将授课内容与课后作业紧密结合,有助学生巩固所学内容,提升上课体验。
-
公开(公告)号:CN112185338B
公开(公告)日:2024-01-23
申请号:CN202011062271.1
申请日:2020-09-30
申请人: 北京大米科技有限公司
IPC分类号: G10L13/02 , G10L13/033 , G10L13/04
摘要: 本发明实施例公开了一种音频处理方法、装置、可读存储介质和电子设备,通过确定第一音频数据,对所述第一音频数据进行分割,以确定包括至少一个音频片段的音频片段序列。根据预设扰动规则对所述音频片段序列中各所述音频片段添加扰动,以调整各所述音频片段对应的音频属性确定目标音频片段序列。拼接所述目标音频片段序列中各所述目标音频片段,以确定第二音频数据。本发明实施例通过对音频数据进行分割,获得多个具有对应音频属性的音频片段,对各音频片段添加扰动以调整音调、音量、语速等音频属性,为调整后音频片段确定的音频数据增加情感色彩,提升了合成语音的真实感。
-
公开(公告)号:CN112260853B
公开(公告)日:2023-07-21
申请号:CN202010978643.9
申请日:2020-09-17
申请人: 北京大米科技有限公司
IPC分类号: H04L41/0663 , H04L61/4511 , G06F11/20
摘要: 本申请实施例公开了一种容灾切换方法、装置、存储介质及电子设备,其中,方法包括:以第一网络域名获取对象存储服务对应的静态资源,确定基于所述第一网络域名获取资源失败,获取预存的所述对象存储服务对应的第二网络域名,基于所述第二网络域名访问所述对象存储服务,并获取所述静态资源。采用本申请实施例,可以提升容灾切换的成功率。
-
公开(公告)号:CN112951204B
公开(公告)日:2023-06-13
申请号:CN202110336221.6
申请日:2021-03-29
申请人: 北京大米科技有限公司
IPC分类号: G10L13/08
摘要: 本发明实施例公开了一种语音合成方法和装置,通过确定文本信息以及用于表征文本信息拼读方式的拼读规则,根据拼读规则确定文本信息对应的音素向量序列,其中素向量分别用于表征文本信息中对应的单词。以进一步根据音素向量序列进行语音合成,以确定对应的语音信息。本发明实施例可以通过文本信息的拼读规则直接确定音素向量序列进行语音合成,提高了语音合成效率。
-
-
-
-
-
-
-
-
-