文本生成方法、装置、电子设备及可读存储介质

    公开(公告)号:CN117807985A

    公开(公告)日:2024-04-02

    申请号:CN202311867926.6

    申请日:2023-12-29

    发明人: 李杰 尹康 袁伦喜

    摘要: 本申请公开了一种文本生成方法、装置、电子设备及可读存储介质,包括:获取目标图像;对所述目标图像进行识别,获取用于描述所述目标图像中的目标内容的文本,作为待验证文本;若所述待验证文本包括预设内容,则再次获取用于描述所述目标图像中的目标内容的文本,作为新的待验证文本,直至所述待验证文本不包括预设内容,其中,每次获取到的用于描述所述目标图像中的目标内容的文本不同;在所述待验证文本不包括预设内容的情况下,基于所述待验证文本确定目标文本。本申请可以在待验证文本包括预设内容的情况下自动生成新的待验证文本,并且每次生成的文本并不相同,提高了用户体验。

    人像修复模型的训练方法、人像修复方法和装置

    公开(公告)号:CN113160079A

    公开(公告)日:2021-07-23

    申请号:CN202110396798.6

    申请日:2021-04-13

    发明人: 袁伦喜

    IPC分类号: G06T5/00 G06N3/08

    摘要: 本申请涉及一种人像修复模型的训练方法、人像修复方法和装置。所述方法包括:获取目标高画质人像图片和样本低画质人像图片;对目标高画质人像图片进行降质处理,得到降质人像图片;基于样本低画质人像图片,对降质人像图片进行人像翻译处理,得到与目标高画质人像图片对应的目标低画质人像图片;通过目标高画质人像图片和对应的目标低画质人像图片,对人像修复模型进行训练,直至训练完成,得到已训练好的人像修复模型;人像修复模型用于对低画质人像图片进行人像修复。采用本方法能够提升人像修复效果。

    人像修复模型的训练方法、人像修复方法和装置

    公开(公告)号:CN113160079B

    公开(公告)日:2024-08-02

    申请号:CN202110396798.6

    申请日:2021-04-13

    发明人: 袁伦喜

    摘要: 本申请涉及一种人像修复模型的训练方法、人像修复方法和装置。所述方法包括:获取目标高画质人像图片和样本低画质人像图片;对目标高画质人像图片进行降质处理,得到降质人像图片;基于样本低画质人像图片,对降质人像图片进行人像翻译处理,得到与目标高画质人像图片对应的目标低画质人像图片;通过目标高画质人像图片和对应的目标低画质人像图片,对人像修复模型进行训练,直至训练完成,得到已训练好的人像修复模型;人像修复模型用于对低画质人像图片进行人像修复。采用本方法能够提升人像修复效果。

    基于多设备的影像素材处理方法及相关装置

    公开(公告)号:CN115904168A

    公开(公告)日:2023-04-04

    申请号:CN202211445958.2

    申请日:2022-11-18

    摘要: 本申请提供了一种基于多设备的影像素材处理方法及相关装置,包括:响应于针对目标应用程序中目标控件的点击操作,跳转到影像素材选取页面,影像素材选取页面包括影像素材展示区域和高光时刻生成控件,影像素材展示区域用于展示来自多个影像采集设备的多个影像素材;响应于针对多个影像素材中至少两个影像素材的选取操作,在影像素材展示区域标记出已选取的至少两个目标影像素材;响应于针对高光时刻生成控件的点击操作,显示高光时刻生成画面。如此,用户可以在单个设备上跨端查看和选取来自多个设备的影像素材,极大提高了处理效率,降低制作耗时,优化用户使用体验。

    文本识别方法、文本识别装置、介质与电子设备

    公开(公告)号:CN118015604A

    公开(公告)日:2024-05-10

    申请号:CN202211407144.X

    申请日:2022-11-10

    摘要: 本公开提供一种文本识别方法、文本识别装置、计算机可读存储介质与电子设备,涉及文本识别技术领域。文本识别方法包括:获取视频流中的待识别帧;在获取到参考帧的文本位置信息的情况下,基于所述参考帧的文本位置信息,以及所述待识别帧与所述参考帧的关系,确定所述待识别帧的文本位置信息;所述参考帧是所述视频流中已检测到文本的帧;根据所述待识别帧的文本位置信息,得到所述待识别帧的文本识别结果。本公开能够对视频流中的文本进行准确、高效的识别。

    视频生成方法、装置、电子设备及存储介质

    公开(公告)号:CN117201837A

    公开(公告)日:2023-12-08

    申请号:CN202311385864.5

    申请日:2023-10-24

    发明人: 刘羽 张毅 袁伦喜

    摘要: 本申请实施例公开一种视频生成方法、装置、电子设备及存储介质,该方法包括:获取目标多媒体数据对应的目标检测结果,目标检测结果用于指示目标多媒体数据中包括的目标对象;根据目标检测结果,确定目标模板视频;目标模板视频对应目标风格;根据目标模板视频,确定目标视频生成模型;目标视频生成模型是根据目标模板视频对预训练的视频生成模型进行调整得到的;通过目标视频生成模型根据目标检测结果对目标模板视频进行处理,以生成目标视频,目标视频的视频帧对应目标风格,且目标视频的视频帧中包括目标对象。实施本申请实施例,能够提高生成风格视频的效率。

    张量处理方法、装置、电子设备及存储介质

    公开(公告)号:CN117371537A

    公开(公告)日:2024-01-09

    申请号:CN202311309550.7

    申请日:2023-10-10

    发明人: 李路长 袁伦喜

    摘要: 本申请实施例公开了一种张量处理方法、装置、电子设备及存储介质。所述方法包括:获取神经网络的一层输出的激活张量和第一权重张量,所述第一权重张量为定点数据类型的张量,所述激活张量为浮点数据类型的张量;在预设数据维度,按照目标切分尺寸对所述第一权重张量进行切分,得到多个第一张量;对所述多个第一张量进行重排,得到重排后的多个第一张量;基于所述重排后的多个第一张量,确定第二权重张量;对所述激活张量和所述第二权重张量执行矩阵乘计算,得到所述神经网络的一层的输出张量。直接通过浮点类型的激活张量和整数类型的权重张量进行张量处理,无需额外的反量化计算,可以降低推理时的内存占用大小,同时可以提升矩阵乘的性能。

    图像处理方法、图像处理装置、介质与电子设备

    公开(公告)号:CN118247800A

    公开(公告)日:2024-06-25

    申请号:CN202211668000.X

    申请日:2022-12-23

    IPC分类号: G06V30/412 G06V10/30

    摘要: 本公开提供一种图像处理方法、图像处理装置、计算机可读存储介质与电子设备,涉及图像处理技术领域。图像处理方法包括:获取包含表格的待处理图像;检测所述待处理图像中的可见表格线和不可见表格线,根据检测结果确定所述待处理图像是可见表格图像或不可见表格图像;若确定所述待处理图像是不可见表格图像,则检测所述待处理图像的单元格信息;根据所述单元格信息确定所述待处理图像的单元格内的文本信息;基于所述单元格信息以及所述单元格内的文本信息,生成所述待处理图像对应的目标表格。本公开能够基于待处理图像中的表格,准确、高效的生成对应的目标表格。