-
公开(公告)号:CN118735767A
公开(公告)日:2024-10-01
申请号:CN202410392719.8
申请日:2024-04-01
摘要: 本公开的实施例提供了虚拟试衣方法、装置、设备及存储介质,应用于图像处理技术领域。所述方法包括获取第一人物图像及衣物图像;对所述第一人物图像进行衣物信息的遮罩处理,得到第二人物图像;将所述第二人物图像、所述衣物图像输入预先训练得到的虚拟试衣模型,得到虚拟试衣图像。通过将衣物潜在特征注入到潜在扩散网络中,对真实感的保持和纹理一致性上超过基于生成对抗网络的方案;只需要进行虚拟试衣的用户提供用户图像,即可将衣物试穿到该用户身上,而且对任意姿势都有着较好的结果。能够在极大程度上提升用户的购物体验,也方便了卖家的操作。
-
公开(公告)号:CN113627257B
公开(公告)日:2024-09-10
申请号:CN202110779605.5
申请日:2021-07-09
申请人: 上海智臻智能网络科技股份有限公司
IPC分类号: G06V30/422 , G06V10/26 , G06V10/25 , G06V10/44 , G06T7/60 , G06V10/80 , G06V10/82 , G06N3/0464
摘要: 一种检测方法、检测系统、设备和存储介质,方法包括:获取具有图框的待测建筑图纸;进行图框检测,获得具有图框的图框检测图像;进行第一空间分割,获得多个空间区域图像;对空间区域图像进行目标检测,获得符合建筑构件类别的第一目标图像,第一目标图像中有目标建筑构件;利用第一目标图像进行尺寸检测,获得目标建筑构件的尺寸;对待测建筑图纸进行第一评估,判断目标建筑构件的尺寸是否符合尺寸规格。本发明通过先进行分割再进行目标检测的方式,有利于精确确定目标建筑构件的位置和轮廓,从而降低漏检的概率,并精准测得目标建筑构件的尺寸,进而提高检测精度;相应能够实现人工智能检测,降低对专业人员进行复审的需求,提高了检测流程速度。
-
公开(公告)号:CN110019728B
公开(公告)日:2024-07-26
申请号:CN201711420428.1
申请日:2017-12-25
申请人: 上海智臻智能网络科技股份有限公司
IPC分类号: G06F16/332 , G06F16/36 , G06F16/33
摘要: 一种自动交互方法及存储介质、终端,自动交互方法包括:获取用户问题;利用至少两种方式得到针对所述用户问题的多个答案;根据各个答案的来源参数以及预测概率对所述多个答案进行筛选,所述答案的来源参数和预测概率是根据该答案的获取方式确定的,所述答案的来源参数包括答案的生成耗时,所述筛选具体包括:根据每一答案的来源参数确定该答案对应的重要性权值;计算各个答案的重要性权值与预测概率的乘积;计算各个答案的乘积与生成耗时的商,以作为各个答案的有效分数;根据各个答案的有效分数对所述多个答案进行筛选;输出筛选得到的最优答案。通过本发明技术方案可以提高问答交互过程中响应的准确性和连续性。
-
公开(公告)号:CN118247617A
公开(公告)日:2024-06-25
申请号:CN202410355781.X
申请日:2024-03-26
IPC分类号: G06V10/80 , G06V10/774
摘要: 本发明公开了一种基于多模态大模型的信息处理方法、装置、设备及介质。该方法包括:将目标处理信息输入至预训练的通用多模态大模型中;根据通用多模态大模型中的文本模型输出层针对文本信息的输出结果,确定任务文本描述信息,并将任务文本描述信息输入至决策模型中,获取目标处理信息的任务类型;如果确定任务类型为文本输出任务,则获取通用多模态大模型针对目标处理信息输出的文本输出结果;如果确定任务类型为图片输出任务,则将目标处理信息和任务类型共同输入至图片生成模型中,并获取图片生成模型输出的图片输出结果。本发明实施例的技术方案有效降低大模型改进过程中带来的模型训练成本和部署成本,满足实际场景中的输入输出信息需求。
-
公开(公告)号:CN112150460B
公开(公告)日:2024-03-15
申请号:CN202011112325.0
申请日:2020-10-16
申请人: 上海智臻智能网络科技股份有限公司
发明人: 崔淼
摘要: 本发明实施例提供一种检测方法、检测系统、设备和介质,所述检测方法包括:获得检测图片;将所述检测图片输入第一卷积神经网络处理,所述第一卷积神经网络对所述检测图片的特征数据进行先降维,再升维;根据所述先降维再升维过程得到第一特征数据;根据所述降维过程得到第二特征数据;将所述第一特征数据和所述第二特征数据进行融合,得到空间特征数据;根据空间特征数据,判断缺陷信息。本发明实施例可以提高检测精度。
-
公开(公告)号:CN110019305B
公开(公告)日:2024-03-15
申请号:CN201711362342.8
申请日:2017-12-18
申请人: 上海智臻智能网络科技股份有限公司
IPC分类号: G06F16/242 , G06F16/23 , G06F16/2458
摘要: 一种知识库扩展方法及存储介质、终端,知识库扩展方法包括:获取待处理问题,并对所述待处理问题进行分词,以得到多个原始词语,所述待处理问题为知识库中的标准问或扩展问;对所述多个原始词语进行相关词替换,以得到原始词语与相关词组合或者相关词与相关词组合的多个扩展问句;对每一扩展问句中包括所述相关词的相邻词语之间的组合有效性进行判断;根据判断结果对所述多个扩展问句进行过滤;将过滤后的多个扩展问句作为待处理问题的扩展问加入知识库。通过本发明技术方案可以自动生成扩展问并保证扩展问的有效性。
-
公开(公告)号:CN111400459B
公开(公告)日:2024-03-05
申请号:CN201811614427.5
申请日:2018-12-27
申请人: 上海智臻智能网络科技股份有限公司
IPC分类号: G06F16/332 , G06F40/30
摘要: 本发明提供了一种生成最佳样例的方法,用于从指定泛化目标产生的多个泛化实例中获取最佳样例,所述方法包括:响应于所述多个泛化实例是由所述指定泛化目标基于预置知识库生成的,获取所述指定泛化目标于所述预置知识库中对应的标准问相关联的多个具体语义表达式,所述预置知识库中包括多个知识点,每个知识点对应于一标准问,所述标准问关联有多个具体语义表达式来表示所述标准问;以及基于所述多个具体语义表达式选取预设数目的泛化样例,所述预设数目的泛化样例尽可能覆盖最多的具体语义表达式。
-
公开(公告)号:CN117528135A
公开(公告)日:2024-02-06
申请号:CN202311465659.X
申请日:2023-11-06
IPC分类号: H04N21/233 , H04N21/234 , H04N21/439 , H04N21/44 , G10L21/055 , G10L15/25 , G10L25/57 , G10L25/30 , G06V40/16 , G06V10/82 , G06N3/0475 , G06N3/045
摘要: 本发明公开了一种语音驱动的脸部视频生成方法、装置、电子设备及介质。该方法包括:获取嘴型驱动语音以及待驱动的脸部视频,并将嘴型驱动语音转换为脸部视频中目标形象的嘴部PCA参数序列;将目标形象的嘴部PCA参数序列,通过PCA逆运算转换为嘴部轮廓信息序列;使用嘴部轮廓信息序列中的各嘴部轮廓信息,基于预先训练的嘴到脸转换模型对脸部视频中各脸部视频帧的嘴部区域进行转换,得到嘴型驱动视频。本发明实施例的技术方案将音频特征与人脸图像特征进行解耦,采用嘴部特征作为中间变量,实现语音驱动的脸部视频生成,可以在有效提升语音驱动的脸部视频生成速度的同时,最大程度的保证视频中的音唇同步性以及脸部形象的自然度。
-
公开(公告)号:CN109933777B
公开(公告)日:2024-02-06
申请号:CN201711362321.6
申请日:2017-12-18
申请人: 上海智臻智能网络科技股份有限公司
IPC分类号: G06F40/242 , G06F40/284 , G06F40/289 , G06F16/33 , G06F16/332
摘要: 一种知识库扩展装置,该装置包括:数据获取模块,用以获取待扩展问题,并对所述待扩展问题进行分词,以得到多个原始词语,所述待处理问题为知识库中的标准问或扩展问;替换模块,用以对所述多个原始词语进行相关词替换,以得到原始词语与相关词组合或者相关词与相关词组合组合的多个扩展问句;判断模块,用以对每一扩展问句中包括所述相关词的相邻词语之间的组合有效性进行判断;过滤模块,用以根据判断结果对所述多个扩展问句进行过滤;输出模块,用以将过滤后的多个扩展问句作为待处理问题的扩展问加入知识库。通过本发明技术方案可以自动生成扩展问并保证扩展问的有效性。
-
公开(公告)号:CN110442506B
公开(公告)日:2023-12-12
申请号:CN201910757698.4
申请日:2019-08-16
申请人: 上海智臻智能网络科技股份有限公司 , 上海器魂智能科技有限公司
IPC分类号: G06F11/34
摘要: 本发明实施例提供一种日志获取方法、装置、业务服务器、系统及存储介质,其中方法包括:从应用容器引擎的设定监听地址,监听所述应用容器引擎产生的日志;判断所述日志是否为第一容器的日志,所述第一容器由用户端预先指定;若所述日志为所述第一容器的日志,将所述日志发送给所述用户端。本发明实施例可提升日志获取的实时性。
-
-
-
-
-
-
-
-
-