-
公开(公告)号:CN118734816A
公开(公告)日:2024-10-01
申请号:CN202411232057.4
申请日:2024-09-04
申请人: 粤港澳大湾区数字经济研究院(福田)
IPC分类号: G06F40/174
摘要: 本申请公开了一种单元格关系预测方法、预测模型训练方法及表格解析方法,预测方法包括获取待预测文档表格结构图;将待预测文档表格结构图输入单元格关系预测模型,通过单元格关系预测模型输出所述待预测文档表格结构图中词Token之间的单元格关系,词Token之间的单元格关系包括同单元格关系矩阵、同行下一个单元格关系矩阵以及同列下一个单元格关系矩阵。本申请实施例通过将单元格关系划分为同单元格关系、同行下一个单元格关系以及同列下一个单元格关系,然后通过经过训练的单元格关系预测模型对待预测文档表格结构图进行关系预测,输出各词Token之间的准确单元格关系,以便于更好地对表格结构进行解析,特别是对于复杂表格,也可以解析到准确的表结构。
-
公开(公告)号:CN118233699A
公开(公告)日:2024-06-21
申请号:CN202410634874.6
申请日:2024-05-22
申请人: 粤港澳大湾区数字经济研究院(福田) , 杭州盖视科技有限公司
摘要: 本申请公开了一种视频编辑方法、装置、设备及存储介质,所述方法包括接收用户输入的人像视频,基于人像视频确定待编辑图像帧集;响应针对待编辑图像帧集的编辑操作,对待编辑图像帧集中的第一图像帧和第二图像帧进行编辑,得到第一参考图像和第二参考图像;基于待编辑图像帧集的条件图像集、第一参考图像和第二参考图像,通过预设扩散模型确定编辑后的图像帧集,根据编辑后的图像帧集得到编辑后的人像视频。本申请通过在用户输入的人像视频中选取待编辑后图像帧,并通过编辑操作来确定第一参考图像和第二参考图像,然后利用预设扩散模型中的自注意力机制来准确捕捉图像帧的人像关键点特征与参考图像的对应关系,提升了视频编辑的稳定性。
-
公开(公告)号:CN117953855B
公开(公告)日:2024-06-18
申请号:CN202410346345.6
申请日:2024-03-26
申请人: 粤港澳大湾区数字经济研究院(福田) , 杭州盖视科技有限公司
摘要: 本申请公开了一种语音合成模型的训练方法、语音合成方法及设备,该训练方法包括基于第一训练语音数据集对初始语音转换模型进行训练以得到目标语音转换模型;基于所述目标语音转换模型确定第二训练语音数据集中的各第二训练语音对应的第一转换语音,并基于各第二训练语音及其对应的第一转换语音构建训练语音组以得到第三训练语音数据集;基于各训练语音组训练初始语音重建模型以得到目标语音重建模型;基于目标语音转换模型和目标语音重建模型确定语音合成模型。本申请先用低质量语音加强泛化性,再用高质量语音进行重建,减少了高质量语音的需求量,降低了高质量零样本的语音合成模型的训练成本,进而降低了零样本语音合成的合成成本。
-
公开(公告)号:CN117828536B
公开(公告)日:2024-06-11
申请号:CN202410238511.0
申请日:2024-03-04
申请人: 粤港澳大湾区数字经济研究院(福田)
IPC分类号: G06F18/25 , G06F18/213 , G06N3/04
摘要: 本发明公开了一种节点交互的预测方法、模型、终端及介质,所述方法包括:基于连续时间动态图,获取目标节点对中每个节点在t时刻的预设历史时长内发生交互的历史邻居节点序列;提取历史邻居节点序列的特征,获得原始特征;统计节点的交互频率,获得交互频率特征;对齐原始特征和交互频率特征,获得对齐嵌入表征,对对齐嵌入表征特征在频域上进行频率增强,获得频域融合特征;基于目标节点对中所有节点的频域融合特征,预测目标节点对中的节点之间在t时刻的交互概率,获得交互预测结果。能够捕获邻居节点当中共同出现的频率,解决频域中存在的“移位”现象,交互预测更加精准。
-
公开(公告)号:CN117974849B
公开(公告)日:2024-06-04
申请号:CN202410361880.9
申请日:2024-03-28
申请人: 粤港澳大湾区数字经济研究院(福田) , 杭州盖视科技有限公司
摘要: 本发明公开了音频驱动面部运动生成的方法、系统、终端及存储介质,涉及计算机视觉技术领域。方法通过获取音频数据和包含人像的视频数据;根据视频数据提取每帧图像的目标三维面部系数,针对每帧图像,根据该帧图像和相邻的若干帧图像提取该帧图像的目标三维面部系数;根据音频数据和视频数据的目标三维面部系数生成视频数据中人像的面部运动,得到目标视频数据。本发明可以稳定提取视频中人像的三维面部系数,通过三维面部系数准确地反映人像的细节信息与立体信息,并将用于驱动的音频数据和视频数据的三维面部系数相结合来转换视频中人像的口型和面部运动,使得视频中人像讲话自然且正确性较高,最终得到与音频数据高度对齐的目标视频数据。
-
公开(公告)号:CN117478305B
公开(公告)日:2024-04-16
申请号:CN202311831920.3
申请日:2023-12-28
申请人: 粤港澳大湾区数字经济研究院(福田)
摘要: 本发明公开了一种基于两方安全协作的全同态加密方法、系统、终端及介质,运算方对第一密文和第二密文进行同态除法运算时,计算第二密文与掩码的乘积,获得掩码后密文,将所述掩码后密文发送至数据方,当接收到所述数据方发送的第三密文时,计算所述第三密文与所述掩码的乘积,获得掩码后的第三密文,计算所述掩码后的第三密文与所述第一密文的乘积,获得同态除法运算结果。计算精确度高,取值范围广,对分母取值没有约束。进行同态密文数据均值计算时,能够高效、高精度地求解出同态密文数据的均值。
-
公开(公告)号:CN117349868B
公开(公告)日:2024-04-12
申请号:CN202311641868.5
申请日:2023-12-04
申请人: 粤港澳大湾区数字经济研究院(福田)
摘要: 本申请公开了一种基于GPU的全同态加解密方法、电子设备和存储介质,所述基于GPU的全同态加解密方法包括:获取算法参数,并通过预设生成器生成上下文参数和密钥;基于预设编码器、所述算法参数、所述上下文参数和所述密钥对待处理明文数据进行编码和加密,得到密文数据;根据自定义计算任务,对所述密文数据进行计算处理,得到密文计算结果;对所述密文计算结果进行解密和反编码,获得目标明文数据。本申请的技术方案结合了GPU覆盖了全同态加解密的计算全流程,提高了隐私计算流程的执行效率。
-
公开(公告)号:CN117742664A
公开(公告)日:2024-03-22
申请号:CN202410182965.0
申请日:2024-02-19
申请人: 粤港澳大湾区数字经济研究院(福田)
IPC分类号: G06F7/72 , G06F13/16 , G06F16/901
摘要: 本申请公开了一种基于GPU的求模方法、装置、设备及介质,属于求模运算的技术领域。在本申请中,提出一种基于GPU的求模方法。首先,确定进行求模运算的GPU,根据GPU的共享存储区的存储空间大小确定查找表的长度,根据除数以及除数的二进制表示长度确定查找表每一位的数值,然后,将除数、各个被除数以及查找表存储至GPU的共享存储区,通过GPU对除数和被除数数组中的各个被除数进行基于查找表的求模运算,输出各个被除数对应的余数。以此,通过GPU对除数和被除数数组中的各个被除数进行基于查找表的求模运算,提升除数不变的大规模求模运算的计算机处理效率。
-
公开(公告)号:CN117459215A
公开(公告)日:2024-01-26
申请号:CN202311800307.5
申请日:2023-12-26
申请人: 粤港澳大湾区数字经济研究院(福田)
摘要: 本发明公开了一种基于全同态加密的问卷测评方法、统计系统、终端及介质,每轮次测评时,客户端将问卷测评结果转换为二进制格式的结果密文,服务端根据运算规则对结果密文进行同态运算,获得分值密文,运算简单方便。服务端根据测评问卷的分值区段的端点生成端点向量密文,再利用客户端来根据分值密文和端点向量密文确定测评结果对应的分值区段,生成结果向量密文,服务端通过比对结果向量密文和端点向量密文,得到测评结果对应的分值区段,再将比较结果向量和测评结论向量相乘,获得测评结果密文,发送至客户端解密并显示。通过采用与分值区段对应的各种向量形式的密文,并利用客户端协作,运算速度快,计算精度高。
-
公开(公告)号:CN117435200A
公开(公告)日:2024-01-23
申请号:CN202311766116.1
申请日:2023-12-21
申请人: 粤港澳大湾区数字经济研究院(福田)
摘要: 本发明公开了一种同态加密业务代码转译方法、装置、设备及计算机可读存储介质,涉及信息安全技术领域,其中方法包括:获取待转译代码,待转译代码为将同态加密业务中的计算逻辑以计算表达式的形式编写的代码;将待转译代码转换为表征计算表达式的计算逻辑的有向无环图;通过遍历有向无环图获得算法决策指标值,并根据算法决策指标值从预设的各种同态加密算法库中,确定出待调用的目标同态加密算法;按照预设的优化策略对有向无环图进行优化,并按照优化后的有向无环图调用目标同态加密算法,以执行计算表达式的计算逻辑。本发明提出一种同态加密业务代码转译方案,提高开发者开发同态加密业务代码的便捷度,提高开发效率。
-
-
-
-
-
-
-
-
-