-
公开(公告)号:CN115311608A
公开(公告)日:2022-11-08
申请号:CN202211238639.4
申请日:2022-10-11
Applicant: 之江实验室
Abstract: 本发明公开一种多任务多目标关联追踪的方法及装置,该方法包括:步骤一,通过系统后台加载视频流地址或采用摄像头实时采集场景的视频流数据,并对视频进行编解码、抽帧、预处理操作;步骤二,利用目标检测模型对视频的图像数据进行实时推理,获取场景中人员和目标物体的检测结果数据;步骤三,通过人员目标追踪方法,对人员检测结果进行跟踪,获取人员进入场景和离开场景的时间,确定检测单位时间段;步骤四,判断人员停留在场景的时间段内,是否检测到目标物体,如果未检测到目标物体,将返回报警信息给平台端。本发明实现了在多人员和多目标的复杂场景,使用人工智能的方式进行智能检测,减少了人为因素的干扰,并且节约了人工成本。
-
公开(公告)号:CN117743472B
公开(公告)日:2024-05-07
申请号:CN202410171179.0
申请日:2024-02-06
Applicant: 之江实验室
IPC: G06F16/27 , G06F16/25 , G06F16/23 , G06F16/242
Abstract: 本说明书公开了一种存储任务断点同步方法、装置、介质及设备,响应于继续执行指令,确定存储任务的任务标识和存储任务对应的布隆过滤器。根据存储任务,确定目的存储器,以及读取各待存储的数据单元的唯一标识。依次针对每个待存储的数据单元,根据该数据单元的唯一标识,以及布隆过滤器,判断该数据单元是否未存储。若是,将该数据单元存储到目的存储器,更新布隆过滤器,直至将各待存储的数据单元都存储至目的存储器为止。否则继续判断下一个数据单元是否未存储。存储任务中断后继续执行的过程中,通过更新的布隆过滤器,能够高效准确的判断待存储的数据单元是否未存储,使得存储任务中断后能够在断点处及时运行,实现了存储任务的及时完成。
-
公开(公告)号:CN117219055A
公开(公告)日:2023-12-12
申请号:CN202311423804.8
申请日:2023-10-27
Applicant: 之江实验室
IPC: G10L13/10 , G10L13/027 , G10L25/03 , G10L25/90
Abstract: 本说明书公开了一种基于音色分离的语音生成方法、装置、介质及设备。所述方法包括:获取目标文本以及目标对象的参考语音;将目标文本输入预先训练的语义特征提取模型,以通过语义表征模型,确定目标文本对应的语义特征,以及,将参考语音输入预先训练的语音风格提取模型,以通过语音风格提取模型,确定参考语音对应的语音风格特征;将语义特征以及语音风格特征输入预先训练的语音生成模型,以通过语音生成模型,根据语义特征,将目标文本转换为具有语音风格特征所对应的语音风格信息的目标语音。
-
公开(公告)号:CN116451808B
公开(公告)日:2024-02-13
申请号:CN202310451948.8
申请日:2023-04-23
IPC: G06N20/00 , G06V10/40 , G06F40/226 , G06F40/194
Abstract: 本说明书公开了一种模型训练的方法、装置、存储介质及电子设备,获取图文对和翻译文本对,将图文对中的描述文本和翻译文本对包含的两种语言文本输入到预设的视觉语言模型中的文本特征提取层中,以通过文本特征提取层得到描述文本和两种语言文本的文本特征,并将图文对中的图像输入到视觉语言模型中的图像特征提取层中,以通过图像特征提取层得到图像的图像特征。根据图文对中图像的图像特征与描述文本的文本特征,以及翻译文本对中包含的两种语言文本的文本特征,确定目标损失;根据目标损失,对视觉语言模型进行训练。
-
公开(公告)号:CN117351946A
公开(公告)日:2024-01-05
申请号:CN202311413996.4
申请日:2023-10-27
Applicant: 之江实验室
IPC: G10L15/06 , G10L15/183 , G10L15/26 , G10L19/04
Abstract: 本说明书公开了一种语音识别方法、装置、存储介质及电子设备。在本说明书提供的语音识别方法中,获取样本文本;将所述样本文本输入待训练的双向语言模型,所述双向语言模型至少包括前向预测子网、后向预测子网、融合子网;通过所述前向预测子网根据所述样本文本得到前向预测结果,并通过所述后向预测子网根据所述样本文本得到后向预测结果;通过所述融合子网对所述前向预测结果和所述后向预测结果进行融合,得到双向预测结果;根据所述双向预测结果和所述样本文本之间的差异,对所述双向语言模型进行训练;采用所述双向语言模型对语音识别模型进行知识迁移;采用知识迁移后的语音识别模型进行语音识别。
-
-
公开(公告)号:CN115424109A
公开(公告)日:2022-12-02
申请号:CN202210987590.6
申请日:2022-08-17
Abstract: 本发明涉及图像处理领域,具体涉及一种可形变实例级图像翻译方法,其解决了现有技术中,域之间差距过大而导致的实例难以形变、实例无法和掩码信息保持一致的问题。其将前景的边缘信息、背景掩码信息和目标域标签信息的特征编码进行融合,获得混合掩码;然后,将背景特征和混合掩码,输入生成器,生成器的解码网络将输入的背景特征进行解码,同时从混合掩码提取附加信息,并将提取的附加信息作用于归一化后的解码输出上,通过附加信息对归一化后的解码输出进行仿射变换,从而获得了包括对应目标域掩码的前景信息和指示前景位置的位置信息的融合信息;最终,利用位置信息将生成的前景信息和源域背景图像进行融合,输出保留源域背景的目标域图片。
-
公开(公告)号:CN117743472A
公开(公告)日:2024-03-22
申请号:CN202410171179.0
申请日:2024-02-06
Applicant: 之江实验室
IPC: G06F16/27 , G06F16/25 , G06F16/23 , G06F16/242
Abstract: 本说明书公开了一种存储任务断点同步方法、装置、介质及设备,响应于继续执行指令,确定存储任务的任务标识和存储任务对应的布隆过滤器。根据存储任务,确定目的存储器,以及读取各待存储的数据单元的唯一标识。依次针对每个待存储的数据单元,根据该数据单元的唯一标识,以及布隆过滤器,判断该数据单元是否未存储。若是,将该数据单元存储到目的存储器,更新布隆过滤器,直至将各待存储的数据单元都存储至目的存储器为止。否则继续判断下一个数据单元是否未存储。存储任务中断后继续执行的过程中,通过更新的布隆过滤器,能够高效准确的判断待存储的数据单元是否未存储,使得存储任务中断后能够在断点处及时运行,实现了存储任务的及时完成。
-
公开(公告)号:CN117421129A
公开(公告)日:2024-01-19
申请号:CN202311722259.2
申请日:2023-12-14
Applicant: 之江实验室
Abstract: 本说明书公开了一种基于异构存储集群的业务执行方法、装置及电子设备。所述方法包括:获取各异构存储设备对应的性能指标信息以及不同业务与各性能指标之间的映射关系;在接收到业务请求后,确定待执行业务对应的目标性能指标;根据性能指标信息,在各存储设备中选取出满足目标性能指标的各存储设备,作为候选设备;针对每个候选设备,确定该候选设备当前的可用容量和负载均衡权值;根据每个候选设备对应的可用容量和负载均衡权值,在各候选设备中确定出该待执行业务对应的目标存储设备,以根据每个待执行业务对应的目标存储设备执行业务,满足不同业务的应用程序和工作负载的多样性需求。
-
公开(公告)号:CN117389792A
公开(公告)日:2024-01-12
申请号:CN202311712644.9
申请日:2023-12-13
Applicant: 之江实验室
Abstract: 本说明书公开了一种故障排查方法、装置、存储介质及电子设备。在本说明书提供的故障排查方法中,获取用户输入的目标追踪标识;根据追踪标识与业务链路之间的预设的对应关系,确定与所述目标追踪标识对应的目标业务链路;采集所述目标业务链路中包含的各服务的运行数据;根据所述运行数据,确定所述各服务中产生的故障;根据所述故障以及预设的公共字段,生成故障日志并反馈给所述用户,所述公共字段用于表征故障信息。
-
-
-
-
-
-
-
-
-