-
公开(公告)号:CN110019952B
公开(公告)日:2023-04-18
申请号:CN201710940199.X
申请日:2017-09-30
申请人: 华为技术有限公司 , 中国科学院自动化研究所
IPC分类号: G06F16/738 , G06V20/40 , G06V10/774 , G06V10/82 , G06N3/0464
摘要: 本发明实施例提供了一种视频描述方法、系统及装置,其中,该方法可以利用基于卷积神经网络的视频编码器提取待描述视频中当前时刻视频帧的视觉特征表示;将当前时刻的视觉特征表示写入到当前时刻的视觉记忆存储器中;根据当前时刻的视觉记忆存储器和当前时刻的文本记忆存储器从当前时刻的属性记忆存储器中读取属性信息;利用基于长短时记忆网络的文本解码器根据上一时刻单词和当前时刻读取的属性信息生成预测的单词。可见,该实施例采用多模态描述方法,有助于增加视频描述的灵活性。
-
公开(公告)号:CN110019952A
公开(公告)日:2019-07-16
申请号:CN201710940199.X
申请日:2017-09-30
申请人: 华为技术有限公司 , 中国科学院自动化研究所
IPC分类号: G06F16/738 , G06K9/00 , G06K9/62 , G06N3/04
摘要: 本发明实施例提供了一种视频描述方法、系统及装置,其中,该方法可以利用基于卷积神经网络的视频编码器提取待描述视频中当前时刻视频帧的视觉特征表示;将当前时刻的视觉特征表示写入到当前时刻的视觉记忆存储器中;根据当前时刻的视觉记忆存储器和当前时刻的文本记忆存储器从当前时刻的属性记忆存储器中读取属性信息;利用基于长短时记忆网络的文本解码器根据上一时刻单词和当前时刻读取的属性信息生成预测的单词。可见,该实施例采用多模态描述方法,有助于增加视频描述的灵活性。
-
公开(公告)号:CN109964478A
公开(公告)日:2019-07-02
申请号:CN201780059854.9
申请日:2017-10-14
申请人: 华为技术有限公司
IPC分类号: H04N5/232
摘要: 一种拍摄方法以及电子装置。其中,拍摄方法包括:检测相机当前是否处于稳定拍摄状态;在相机当前处于稳定拍摄状态时,获取第一时刻的图像数据;根据第一时刻的图像数据,确定目标拍摄类型;在接收到来自用户的拍摄指示时,获取第二时刻的图像数据;根据目标拍摄类型对应的图像处理方式,对第二时刻的图像数据进行处理,从而得到目标图像数据。该方法能够避免场景识别算法被无效的执行,降低了计算的负担,从而提高了的运行速度。
-
公开(公告)号:CN101834608A
公开(公告)日:2010-09-15
申请号:CN200910106033.3
申请日:2009-03-10
申请人: 华为技术有限公司
IPC分类号: H03M7/30
摘要: 本发明实施例公开了一种多通道编解码器运行方法和装置,其中,所述多通道编解码器运行方法包括以下步骤:将编解码算法代码预先分成多个代码段,且设置有所述代码段与通道的对应关系;当需要运行多种编解码算法时,从片外存储空间依次搬移编解码算法对应的代码段到片内第一程序运行空间,对对应的通道依次执行从所述片外存储空间搬移来的代码段。通过本发明实施例,可以实现算法代码段的动态加载,不需要重新复位DSP,节省了代码加载运行的时间,减少了系统延时。
-
公开(公告)号:CN118264889A
公开(公告)日:2024-06-28
申请号:CN202311165317.6
申请日:2023-09-08
申请人: 华为技术有限公司
摘要: 本申请实施例提供了一种图像处理的方法和电子设备,方法包括:响应于用户通过第一终端设备采集第一图像的操作,通过对第一图像进行编码,得到第一编码文件;当检测到用户的第一操作,和/或,第一终端设备满足第一条件时,向服务器发送第一编码文件;接收服务器发送的第二图像,该第二图像是服务器通过对该第一编码文件中的第一图像进行云增强处理得到的。通过该方法和电子设备,能够避免在终端设备处于高负载、过热或者网络状况不佳时的上云传输。
-
公开(公告)号:CN101378512B
公开(公告)日:2010-11-03
申请号:CN200710145742.3
申请日:2007-08-31
申请人: 华为技术有限公司
摘要: 本发明公开了一种音视频数据同步的方法,其特征在于,该方法包括:接收原始的音频数据、视频数据;存储原始的音频数据、视频数据;分别将原始的音频数据、视频数据进行解码,包括:当在远端进行解码时,对所有需要解码的数据进行解码;当在本地进行解码时,按照固定的帧速率解码;当有解码数据输出时,对解码的音频数据、视频数据进行编码,包括:当解码没有输出时,则不启动编码;当解码有输出时,按照预置的帧速率编码;存储编码的音频数据、视频数据;将所述的编码的音频数据、视频数据同时发送。本发明还提供了一种音视频数据同步装置,该装置包括:接收单元、解码单元、编码单元、存储单元、发送单元。通过本发明能够解决音、视频数据同步的问题。
-
公开(公告)号:CN114239668A
公开(公告)日:2022-03-25
申请号:CN202010937433.5
申请日:2020-09-08
摘要: 本申请实施例公开了一种模型更新的方法,用于联邦学习场景,针对用户数据分布提出了一种新的加权系数计算方法。本申请实施例方法终端将训练好的模型以及本地数据的分布特征都发给云端,用本地数据的分布特征替代统一的加权系数,用于实现模型聚合,使得聚合后的模型更大程度的保留用户的知识,以提高聚合模型的性能。此外,还提出了模型聚合的策略,对多模型采用分组聚合模式,进一步提升了聚合后模型的性能。
-
公开(公告)号:CN113890989A
公开(公告)日:2022-01-04
申请号:CN202110984386.4
申请日:2017-10-14
申请人: 华为技术有限公司
IPC分类号: H04N5/232
摘要: 一种拍摄方法以及电子装置。其中,拍摄方法包括:检测相机当前是否处于稳定拍摄状态;在相机当前处于稳定拍摄状态时,获取第一时刻的图像数据;根据第一时刻的图像数据,确定目标拍摄类型;在接收到来自用户的拍摄指示时,获取第二时刻的图像数据;根据目标拍摄类型对应的图像处理方式,对第二时刻的图像数据进行处理,从而得到目标图像数据。该方法能够避免场景识别算法被无效的执行,降低了计算的负担,从而提高了的运行速度。
-
公开(公告)号:CN107545262B
公开(公告)日:2020-11-06
申请号:CN201710642311.1
申请日:2017-07-31
申请人: 华为技术有限公司
摘要: 一种在自然场景图像中检测文本的方法及装置,用以解决现有技术中从不同复杂程度的自然场景图像中检测文本精度较低的问题。该方法包括:获取自然场景图像,通过FCN模型,对获取的自然场景图像进行卷积运算,得到自然场景图像的卷积特征,根据自然场景图像的卷积特征,确定自然场景图像中包括的文本候选区域序列,针对文本候选区域序列中的每一文本候选区域,执行:通过感兴趣区域池化层,提取文本候选区域的卷积特征,并通过特征变换,将文本候选区域的卷积特征,转化为固定维度k的特征向量,根据时间递归网络模型和固定维度k的特征向量,确定文本候选区域中包括的文本行的位置,其中k为正整数。
-
公开(公告)号:CN101834608B
公开(公告)日:2014-05-07
申请号:CN200910106033.3
申请日:2009-03-10
申请人: 华为技术有限公司
IPC分类号: H03M7/30
摘要: 本发明实施例公开了一种多通道编解码器运行方法和装置,其中,所述多通道编解码器运行方法包括以下步骤:将编解码算法代码预先分成多个代码段,且设置有所述代码段与通道的对应关系;当需要运行多种编解码算法时,从片外存储空间依次搬移编解码算法对应的代码段到片内第一程序运行空间,对对应的通道依次执行从所述片外存储空间搬移来的代码段。通过本发明实施例,可以实现算法代码段的动态加载,不需要重新复位DSP,节省了代码加载运行的时间,减少了系统延时。
-
-
-
-
-
-
-
-
-