-
公开(公告)号:CN101231585B
公开(公告)日:2010-12-01
申请号:CN200810007026.3
申请日:2008-01-25
申请人: 辉达公司
CPC分类号: G06F8/456
摘要: 一种虚拟结构和指令集支持明确的并行线程计算。所述虚拟结构定义:虚拟处理器,其支持具有不同虚拟线程之间的不同级别的数据共享和协调(例如,同步)的多个虚拟线程的并发执行;以及虚拟执行驱动器,其控制所述虚拟处理器。所述虚拟处理器的虚拟指令集结构用来定义虚拟线程的行为,且包含与并行线程行为(例如,数据共享和同步)有关的指令。通过使用所述虚拟平台,编程人员能够开发出其中虚拟线程并发地执行以处理数据的应用程序;虚拟翻译器和驱动器以对于所述编程人员透明的方式来调适所述应用程序代码以适应其所执行于的特定硬件。
-
公开(公告)号:CN101231585A
公开(公告)日:2008-07-30
申请号:CN200810007026.3
申请日:2008-01-25
申请人: 辉达公司
CPC分类号: G06F8/456
摘要: 一种虚拟结构和指令集支持明确的并行线程计算。所述虚拟结构定义:虚拟处理器,其支持具有不同虚拟线程之间的不同级别的数据共享和协调(例如,同步)的多个虚拟线程的并发执行;以及虚拟执行驱动器,其控制所述虚拟处理器。所述虚拟处理器的虚拟指令集结构用来定义虚拟线程的行为,且包含与并行线程行为(例如,数据共享和同步)有关的指令。通过使用所述虚拟平台,编程人员能够开发出其中虚拟线程并发地执行以处理数据的应用程序;虚拟翻译器和驱动器以对于所述编程人员透明的方式来调适所述应用程序代码以适应其所执行于的特定硬件。
-
公开(公告)号:CN101556543B
公开(公告)日:2014-04-23
申请号:CN200910117897.5
申请日:2009-04-09
申请人: 辉达公司
发明人: 维诺德·格罗夫 , 巴斯蒂安·约翰·马特乌斯·阿特斯 , 迈克尔·墨菲 , 贾扬特·B·科尔希 , 约翰·布赖恩·波尔曼 , 道格拉斯·塞勒
CPC分类号: G06F9/45537 , G06F8/45 , G06F8/456 , G06F9/4843 , G06F11/261 , G06F12/0253
摘要: 本发明公开了一种由通用处理器执行重定目标的图形处理器加速代码。本发明的一个实施例提出了一种技术,用于将使用并行编程模型编写的用于在多核图像处理单元(GPU)上执行的应用程序翻译成用于由通用中央处理单元(CPU)执行。所述应用程序中依赖于多核GUP的特定特征的部分由翻译器转换成由通用CPU执行。所述应用程序被划分为同步独立指令区域。所述指令被分类为收敛的或发散的,并且在区域之间共享的发散存储器基准被复制。插入线程循环,以确保在由通用CPU执行期间各种线程之间存储器的正确共享。
-
公开(公告)号:CN101556543A
公开(公告)日:2009-10-14
申请号:CN200910117897.5
申请日:2009-04-09
申请人: 辉达公司
发明人: 维诺德·格罗夫 , 巴斯蒂安·约翰·马特乌斯·阿特斯 , 迈克尔·墨菲 , 贾扬特·B·科尔希 , 约翰·布赖恩·波尔曼 , 道格拉斯·塞勒
CPC分类号: G06F9/45537 , G06F8/45 , G06F8/456 , G06F9/4843 , G06F11/261 , G06F12/0253
摘要: 本发明公开了一种由通用处理器执行重定目标的图形处理器加速代码。本发明的一个实施例提出了一种技术,用于将使用并行编程模型编写的用于在多核图像处理单元(GPU)上执行的应用程序翻译成用于由通用中央处理单元(CPU)执行。所述应用程序中依赖于多核GUP的特定特征的部分由翻译器转换成由通用CPU执行。所述应用程序被划分为同步独立指令区域。所述指令被分类为收敛的或发散的,并且在区域之间共享的发散存储器基准被复制。插入线程循环,以确保在由通用CPU执行期间各种线程之间存储器的正确共享。
-
公开(公告)号:CN101556544B
公开(公告)日:2013-09-18
申请号:CN200910117898.X
申请日:2009-04-09
申请人: 辉达公司
CPC分类号: G06F9/45537 , G06F8/45 , G06F8/456 , G06F9/4843 , G06F11/261 , G06F12/0253
摘要: 本发明公开了一种为了用于由通用处理器执行而对应用程序重定目标。本发明的一个实施例提出了一种技术,用于将使用并行编程模型编写的用于在多核图像处理单元(GPU)上执行的应用程序翻译成用于由通用中央处理单元(CPU)执行。所述应用程序中依赖于多核GUP的特定特征的部分由翻译器转换成由通用CPU执行。所述应用程序被划分为同步独立指令区域。所述指令被分类为收敛的或发散的,并且在区域之间共享的发散存储器基准被复制。插入线程循环,以确保在由通用CPU执行期间各种线程之间存储器的正确共享。
-
公开(公告)号:CN101556544A
公开(公告)日:2009-10-14
申请号:CN200910117898.X
申请日:2009-04-09
申请人: 辉达公司
CPC分类号: G06F9/45537 , G06F8/45 , G06F8/456 , G06F9/4843 , G06F11/261 , G06F12/0253
摘要: 本发明公开了一种为了用于由通用处理器执行而对应用程序重定目标。本发明的一个实施例提出了一种技术,用于将使用并行编程模型编写的用于在多核图像处理单元(GPU)上执行的应用程序翻译成用于由通用中央处理单元(CPU)执行。所述应用程序中依赖于多核GUP的特定特征的部分由翻译器转换成由通用CPU执行。所述应用程序被划分为同步独立指令区域。所述指令被分类为收敛的或发散的,并且在区域之间共享的发散存储器基准被复制。插入线程循环,以确保在由通用CPU执行期间各种线程之间存储器的正确共享。
-
-
-
-
-