高效卷积运算
    1.
    发明公开
    高效卷积运算 审中-实审

    公开(公告)号:CN115526970A

    公开(公告)日:2022-12-27

    申请号:CN202210715931.4

    申请日:2022-06-23

    发明人: R·金 W·托马斯

    IPC分类号: G06T15/00 G06T1/20

    摘要: 本发明涉及高效卷积运算。描述了一种包括通过GPU流水线中的纹理化/着色单元改进纹理获取的方法。该方法用于高效卷积运算。该方法包括接收着色器以及确定着色器是否为内核着色器。响应于确定着色器是内核着色器,该方法包括修改着色器以对于输出像素群组执行卷积运算中使用的所有纹理像素的集体获取,而不是对于输出像素群组中的每个输出像素执行纹理像素的独立获取。

    在图形处理单元中将纹理处理应用于片段块

    公开(公告)号:CN118247127A

    公开(公告)日:2024-06-25

    申请号:CN202311768584.2

    申请日:2023-12-19

    IPC分类号: G06T1/20 G06T7/40

    摘要: 本发明涉及在图形处理单元中将纹理处理应用于片段块。提供了一种用于将纹理滤波应用于片段块的方法和图形处理单元(GPU),所述片段中的每个片段与针对纹理的多个维度中的每个维度的纹理坐标相关联。检测到针对所述块的所述片段的所述纹理坐标是轴对齐的。针对纹理坐标集合中的每个纹理坐标确定两个或更多个整数纹素坐标。对所确定的整数纹素坐标执行唯一化过程,以移除一个或多个重复整数纹素坐标,并且从而确定所确定的整数纹素坐标的子集。使用所确定的整数纹素坐标的所述子集来生成待提取的纹素的纹素地址。使用所生成的纹素地址来提取纹素。对于所述块的所述片段中的每个片段,通过将滤波应用于所提取的纹素的子组来确定滤波值。输出所述滤波值。

    在图形处理单元中将纹理处理应用于片段块

    公开(公告)号:CN118247126A

    公开(公告)日:2024-06-25

    申请号:CN202311751537.7

    申请日:2023-12-19

    IPC分类号: G06T1/20 G06T7/40

    摘要: 本发明涉及在图形处理单元中将纹理处理应用于片段块。提供了一种用于将纹理处理应用于片段块的方法和图形处理单元(GPU),所述片段中的每个片段与针对纹理的多个维度中的每个维度的纹理坐标相关联。所述GPU的片段处理单元检测到针对所述块的所述片段的所述纹理坐标是轴对齐的,并且响应于检测到针对所述块的所述片段的所述纹理坐标是轴对齐的,将缩减的纹理坐标集合发送到所述GPU的纹理处理单元。所述纹理处理单元:(i)处理所述缩减的纹理坐标集合,以生成待提取的纹素的纹素地址,(ii)使用所生成的纹素地址来提取纹素,(iii)基于所提取的纹素来确定针对所述块的所述片段中的每个片段的处理值,以及(iv)输出所述处理值。

    高效卷积运算
    4.
    发明公开
    高效卷积运算 审中-实审

    公开(公告)号:CN115526971A

    公开(公告)日:2022-12-27

    申请号:CN202210716789.5

    申请日:2022-06-23

    发明人: R·金 W·托马斯

    IPC分类号: G06T15/00 G06T1/20

    摘要: 本发明涉及高效卷积运算。描述了一种在GPU流水线中操作纹理化/着色单元的方法。这种方法用于高效卷积运算。该方法使用纹理硬件来集体获取计算输出像素群组的特性所需的所有纹理像素,而无需任何重复。该方法然后绕过纹理硬件中的双线性滤波器硬件,并且将所获取和未过滤的纹理像素数据从纹理硬件单元传递到纹理化/着色单元中的着色器硬件。着色器硬件使用所获取的纹理像素数据来执行多个卷积运算以计算输出像素中的每一者的特性。