-
公开(公告)号:CN109933327B
公开(公告)日:2021-01-08
申请号:CN201910106880.3
申请日:2019-02-02
申请人: 中国科学院计算技术研究所
IPC分类号: G06F8/41
摘要: 本发明涉及一种基于代码融合编译框架的OpenCL编译器设计方法和系统,包括:基于共享内存提供主机‑内核代码融合编译框架,在编译器的中间表示——AST层上实现不同端代码的融合;WII‑CFG图用来刻画Kernel代码被实例化成众多线程后,线程之间的指令执行行为,亦即分析工作组内平台特征敏感的程序执行行为;主机‑内核代码联合的数据流分析,用来发掘跨越主机端或内核端的数据流关系以及线程之间的数据流关系,以分析两端代码之间的数据相关性;基于前述分析实施针对性的代码优化,并生成汇编代码进而结束编译过程。本发明能面向不同加速设备,针对主机端代码、Kernel代码同时开展分析,充分发掘线程间优化机会,使得OpenCL程序获得良好的性能可移植性。
-
公开(公告)号:CN102332034B
公开(公告)日:2013-10-02
申请号:CN201110322247.1
申请日:2011-10-21
申请人: 中国科学院计算技术研究所
摘要: 本发明提供一种人像图片检索方法和装置,该方法包括下列步骤:1000)接收用户提交的查询;2000)提取所述查询的特征;3000)人像图片库中人像图片的相应特征,计算所述查询与人像图片的匹配程度以进行人像图片检索;其中,所述查询的特征和所述人像图片的特征均包括社会关系特征,所述社会关系特征体现了人像图片中人脸的位置关系。本发明的有益效果在于:鲁棒性强,且检索结果较现有方法的结果更为理想;计算简单,实现速度快。
-
公开(公告)号:CN101944041A
公开(公告)日:2011-01-12
申请号:CN201010292061.1
申请日:2010-09-26
申请人: 中国科学院计算技术研究所
IPC分类号: G06F9/45
摘要: 本发明有关于一种使用陷阱指令优化条件转移代码性能的方法及其系统,其中该方法包括:步骤1,收集程序的轮廓信息,根据轮廓信息获取符合条件的分支指令;步骤2,将符合条件的分支指令转换成陷阱指令,并将陷阱指令的地址及其陷入地址记入陷阱转移表中;步骤3,生成记入有陷阱指令和陷阱转移表的汇编文件,并根据汇编文件生成程序可执行文件;步骤4,解析程序可执行文件,获取陷阱指令的地址与其陷入地址之间的偏移值,并将偏移值记录到陷阱指令的偏移域中;步骤5,运行记入偏移值后的程序可执行文件,当陷阱指令发生陷入时,对陷入进行响应。采用本发明的方法能够减少分支指令的处理时间,提高处理器流水线的吞吐率,获得性能提高。
-
公开(公告)号:CN109901840B
公开(公告)日:2020-10-27
申请号:CN201910114572.5
申请日:2019-02-14
申请人: 中国科学院计算技术研究所
IPC分类号: G06F8/41
摘要: 本发明通过自动选择优化策略以及分维度进行线程间冗余删除的收益代价分析,能自动根据代码是否含有同步操作和硬件平台的特点,针对性地选择一种优化策略,通过对Kernel代码的编译分析,得出合适的合并维度和合并因子,利于提高Kernel代码的运行性能。采用本发明方法能面向多种异构平台,进行自动分析和变换,得以优化设备端代码的线程间冗余和同步开销,提高设备端代码(即OpenCL的Kernel代码)的性能。
-
公开(公告)号:CN104679477B
公开(公告)日:2017-08-01
申请号:CN201510082216.1
申请日:2015-02-15
申请人: 中国科学院计算技术研究所
IPC分类号: G06F9/30
摘要: 本发明提供一种面向可变粒度内存系统的二进制文件重写方法,包括:在二进制文件的中间表示中找到热循环区域;对于访存行为符合可变粒度访存模式的热循环区域,合并该区域内的访存信息,并且在该区域之前插入头语句;以及,根据修改后的热循环区域生成目标机器代码。本发明能够自动完成在二进制文件上支持可变粒度内存系统的访存操作;通过自动分析应用程序特征以及可变粒度内存系统的核心特征,选择合适的重写方式,兼顾了二进制文件重写过程的效率和二进制文件的执行性能。
-
公开(公告)号:CN104679477A
公开(公告)日:2015-06-03
申请号:CN201510082216.1
申请日:2015-02-15
申请人: 中国科学院计算技术研究所
IPC分类号: G06F9/30
摘要: 本发明提供一种面向可变粒度内存系统的二进制文件重写方法,包括:在二进制文件的中间表示中找到热循环区域;对于访存行为符合可变粒度访存模式的热循环区域,合并该区域内的访存信息,并且在该区域之前插入头语句;以及,根据修改后的热循环区域生成目标机器代码。本发明能够自动完成在二进制文件上支持可变粒度内存系统的访存操作;通过自动分析应用程序特征以及可变粒度内存系统的核心特征,选择合适的重写方式,兼顾了二进制文件重写过程的效率和二进制文件的执行性能。
-
公开(公告)号:CN104424026A
公开(公告)日:2015-03-18
申请号:CN201310367751.2
申请日:2013-08-21
申请人: 华为技术有限公司 , 中国科学院计算技术研究所
IPC分类号: G06F9/48
CPC分类号: G06F8/445
摘要: 本发明实施例提供一种指令调度方法及装置,涉及通信领域,能够使得处理器或流水线正常运行,提高了调度的正确性。包括:构建数据依赖图;分别从所述数据依赖图中提取k个指令进行调度得到每一拍的m个超长指令字,使得同一拍内的超长指令字之间是并行执行的关系,相邻两拍中后一拍的任一超长指令字的第t个指令槽的指令与前一拍的任一超长指令字的第t+1个指令槽的指令之间不存在依赖关系;其中,0≤k≤m×n,所述n表示一个超长指令字中指令槽的个数,所述n为大于等于1的整数,所述m表示每拍中超长指令字的个数,所述m为大于等于1的整数,所述t为大于等于1小于等于n-1的整数。本发明实施例提供一种指令调度方法及装置用于指令的调度。
-
公开(公告)号:CN102073676A
公开(公告)日:2011-05-25
申请号:CN201010568307.3
申请日:2010-11-30
申请人: 中国科学院计算技术研究所
摘要: 本发明公开了一种网络色情视频实时检测方法和系统。所述方法包括下列步骤:根据网络视频的长度,建立关键帧预抽取帧号队列KFN={n1,n2,…,nN},其中n1<n2<…<nN;根据所述关键帧预抽取帧号队列,按顺序抽取一帧关键帧并解码;对解码后的关键帧进行色情内容检测,判断该关键帧是否包含色情内容;根据对单个关键帧色情内容的检测结果,连同之前得到的其他关键帧的检测结果,进行决策融合判定:如果判定“是”,则认为该视频包含色情内容,结束检测;如果判定“否”,则认为该视频不包含色情内容,结束检测;如果判定“不定”,则继续进行单个关键帧的检测。
-
公开(公告)号:CN109002713B
公开(公告)日:2020-11-10
申请号:CN201810666911.6
申请日:2018-06-26
申请人: 中国科学院计算技术研究所
摘要: 本发明提供了全局性安全规则检测方法和系统,其中根据设定的全局安全规则在编译器前端从源程序中提取与所述全局安全规则相关的信息并将其保存在与该源程序对应的中间文件中;遍历所有中间文件中保存的信息以检测其是否符合所述全局安全规则;以及响应于检测到不符合所述全局安全规则的信息,发出指示以修改与该信息所在的中间文件对应的源程序。该方法中使得代码的全局安全规则检测可以与代码开发同步进行,能及时检测错误并反馈给各方进行纠正,缩小了错误检测和纠正范围,改善了全局安全规则检测效率,加快了整个项目开发进度。
-
公开(公告)号:CN109002713A
公开(公告)日:2018-12-14
申请号:CN201810666911.6
申请日:2018-06-26
申请人: 中国科学院计算技术研究所
摘要: 本发明提供了全局性安全规则检测方法和系统,其中根据设定的全局安全规则在编译器前端从源程序中提取与所述全局安全规则相关的信息并将其保存在与该源程序对应的中间文件中;遍历所有中间文件中保存的信息以检测其是否符合所述全局安全规则;以及响应于检测到不符合所述全局安全规则的信息,发出指示以修改与该信息所在的中间文件对应的源程序。该方法中使得代码的全局安全规则检测可以与代码开发同步进行,能及时检测错误并反馈给各方进行纠正,缩小了错误检测和纠正范围,改善了全局安全规则检测效率,加快了整个项目开发进度。
-
-
-
-
-
-
-
-
-