图形渲染中的可学习图像变换训练方法和系统

    公开(公告)号:CN118799469A

    公开(公告)日:2024-10-18

    申请号:CN202410427375.X

    申请日:2024-04-10

    摘要: 本公开涉及图形渲染中的可学习图像变换训练方法和系统。提供了一种用于训练帧变换流水线的方法,该帧变换流水线是图形处理系统的一部分,并且被配置成对渲染帧进行变换以产生包括在一组目标图像中呈现的视觉特征的增强帧。帧变换流水线包括一个或多个着色器,该一个或多个着色器由能够复制特定视觉特征的参数化数学函数来定义。该训练方法包括:接收输入图像和目标图像;将每个着色器应用于输入图像以获得候选帧;以及在参数化鉴别器处计算候选帧的特征与目标图像之间的相似性指示。根据该指示,该方法还包括对鉴别器和一个或多个参数化数学函数的参数进行的参数更新步骤,其中该参数更新步骤被配置成从参数化数学函数中导出参数。

    用于构建射线跟踪加速结构的方法和系统

    公开(公告)号:CN113936091B

    公开(公告)日:2024-10-15

    申请号:CN202110784519.3

    申请日:2021-07-12

    发明人: S·芬尼

    摘要: 本发明涉及用于构建射线跟踪加速结构的方法和系统。公开了一种为场景构建射线跟踪加速结构的计算机实现的方法。所述场景相对于全局坐标系被定义,所述加速结构包括顶层加速结构TLAS,所述顶层加速结构具有引用底层加速结构BLAS的一个或多个实例的叶节点。所述方法包括:定义一个或多个TLAS节点;对于每个TLAS节点,确定第一边界体积,并且将所述节点与变换矩阵相关联,所述变换矩阵在所述第一边界体积与所述全局坐标系中的第二边界体积之间映射。

    用于高速缓存压缩数据和非压缩数据的灵活高速缓存结构

    公开(公告)号:CN118550851A

    公开(公告)日:2024-08-27

    申请号:CN202410208109.8

    申请日:2024-02-26

    发明人: R·M·托金顿

    IPC分类号: G06F12/0871 G06F12/0811

    摘要: 用于高速缓存压缩数据和非压缩数据的灵活高速缓存结构。一种装置,其中第一RAM中的每个字段与第二RAM中的相应字段一起形成高速缓存RAM的相应条目。高速缓存电路可操作以在高速缓存RAM中的至少一个条目中应用第一模式与第二模式之间进行选择。在第一模式中,使用所述第一RAM中的相应字段来以第一格式保存单个高速缓存行的第一部分,并且使用所述第二RAM中的相应字段来保存所述单个高速缓存行的对应标签和所述单个高速缓存行的剩余部分。在第二模式中,使用所述第一RAM来以比所述第一格式短的第二格式保存多个高速缓存行,并且使用所述第二RAM中的对应条目来保存所述多个高速缓存行中的对应标签。

    在图形处理单元中将纹理处理应用于片段块

    公开(公告)号:CN118247126A

    公开(公告)日:2024-06-25

    申请号:CN202311751537.7

    申请日:2023-12-19

    IPC分类号: G06T1/20 G06T7/40

    摘要: 本发明涉及在图形处理单元中将纹理处理应用于片段块。提供了一种用于将纹理处理应用于片段块的方法和图形处理单元(GPU),所述片段中的每个片段与针对纹理的多个维度中的每个维度的纹理坐标相关联。所述GPU的片段处理单元检测到针对所述块的所述片段的所述纹理坐标是轴对齐的,并且响应于检测到针对所述块的所述片段的所述纹理坐标是轴对齐的,将缩减的纹理坐标集合发送到所述GPU的纹理处理单元。所述纹理处理单元:(i)处理所述缩减的纹理坐标集合,以生成待提取的纹素的纹素地址,(ii)使用所生成的纹素地址来提取纹素,(iii)基于所提取的纹素来确定针对所述块的所述片段中的每个片段的处理值,以及(iv)输出所述处理值。

    在包括存储器的处理单元处对二维值阵列执行可分离运算

    公开(公告)号:CN118227515A

    公开(公告)日:2024-06-21

    申请号:CN202311754998.X

    申请日:2023-12-19

    IPC分类号: G06F12/02 G06F12/06 G06F9/50

    摘要: 本申请涉及在包括存储器的处理单元处对二维值阵列执行可分离运算。一种对二维值阵列执行可分离运算的计算机实现的方法,在每个写入或读取步骤中,每个存储库仅由一个相应线程写入或读取,方法包括:将阵列划分成子阵列;对于每个子阵列:使用线程对值子阵列执行可分离运算的初始阶段,以便针对子阵列的每个值生成相应处理值;将第一多个处理值写入到存储器,该值对应于一维值序列;读取相应第二多个处理值,该值对应于相对于值子阵列的转置位置中的值子阵列的垂直一维值序列;执行可分离运算的后一阶段,以便针对转置位置中的值子阵列的每个值生成输出值;将处理值写入到每个存储库,从每个存储库中读取相应处理值。

    图像数据解压缩
    6.
    发明公开

    公开(公告)号:CN118158393A

    公开(公告)日:2024-06-07

    申请号:CN202311646158.1

    申请日:2023-12-01

    摘要: 图像数据解压缩。提供了一种用于执行解压缩以从压缩数据中确定一个或多个图像元素值的方法和解压缩单元。该压缩数据表示包括多个图像元素值的图像数据块,每个图像元素值包括与相应的多个通道有关的多个数据值,其中该多个通道包括至少一个参考通道和多个非参考通道。从该压缩数据中读取针对该通道中的每个通道的压缩通道数据。对于该通道中的每个通道,使用针对该通道的该压缩通道数据来确定与针对被解压缩的该一个或多个图像元素值中的每个图像元素值的该通道有关的初始数据值。

    在神经网络加速器上实现分散函数

    公开(公告)号:CN117952155A

    公开(公告)日:2024-04-30

    申请号:CN202311434360.8

    申请日:2023-10-31

    摘要: 本申请涉及在神经网络加速器上实现分散函数。公开了一种在神经网络加速器的固定功能硬件中实现分散运算的方法。将一个或多个索引向量转换为呈独热稀疏格式的稀疏索引张量。通过将更新值应用于该稀疏索引张量中的一个稀疏索引张量(或从该稀疏索引张量中导出的张量)来生成更新张量。在一些示例中,基于该更新张量来更新输入数据张量。在其他示例中,输出该更新张量本身。

    在神经网络加速器上实现分散函数

    公开(公告)号:CN117952154A

    公开(公告)日:2024-04-30

    申请号:CN202311432544.0

    申请日:2023-10-31

    摘要: 本申请涉及在神经网络加速器上实现分散函数。公开了一种在神经网络加速器的固定功能硬件中实现分散运算的方法。将三个或多个索引向量转换为呈独热稀疏格式的稀疏索引张量。通过将更新值应用于该稀疏索引张量中的一个稀疏索引张量(或从该稀疏索引张量中导出的张量)来生成更新张量。在一些示例中,基于该更新张量来更新输入数据张量。在其他示例中,输出该更新张量本身。

    用于纹理解压缩的多输出解码器
    9.
    发明公开

    公开(公告)号:CN117880521A

    公开(公告)日:2024-04-12

    申请号:CN202410178460.7

    申请日:2018-04-28

    发明人: Y-C·富 K·洛维斯

    摘要: 用于纹理解压缩的多输出解码器。提供从接收到的根据ASTC格式编码的纹理数据块解码多个纹素的解码器,其包括:参数解码单元,对针对接收到的纹理数据块的配置数据解码;颜色解码单元,根据配置数据对针对块的多个纹素的颜色端点数据解码;权重解码单元,根据配置数据对针对块的多个纹素中的每个的插值权重数据解码;至少一个插值器单元,使用针对块的多个纹素中的每个的插值权重数据和来自颜色端点数据的一对颜色端点计算针对该纹素的颜色值,参数解码单元、颜色解码单元和权重解码单元中的至少一者从块解码中间数据,中间数据对于该块的至少纹素子集的解码来说是公用的并使用解码后的中间数据作为从纹理数据块解码多个纹素中的至少两个的一部分。

    高效编码方法
    10.
    发明授权

    公开(公告)号:CN113473128B

    公开(公告)日:2024-04-12

    申请号:CN202110338203.1

    申请日:2021-03-30

    摘要: 描述了一种编码数据值的方法,其中将数据值布置成字,每个字包括多个输入值和一个或多个填充位。通过确定字的一部分中的一半以上的位是否为1来编码字,其中所述部分可包括字中的输入值的位中的一些或全部,以及响应于确定所述部分中的一半以上的位为1,反转所述部分中的所有位且将对应填充位设置为指示所述反转的值。