基于驱动封装的GPU分时共享方法及系统

    公开(公告)号:CN112506666B

    公开(公告)日:2024-08-23

    申请号:CN202011525125.8

    申请日:2020-12-22

    Abstract: 本发明公开了一种基于驱动封装的GPU分时共享方法及系统,所述方法包括:获取任务切换指令,并根据所述任务切换指令确定切换前的任务;根据所述切换前的任务,确定所述切换前的任务所占用的GPU显存资源;将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行。本发明可通过截获用户应用对GPU资源的使用,并且在任务切换时,将所述GPU显存资源备份,并在备份完成后释放所述GPU显存资源,以使得切换后的任务使用GPU并运行,从而实现了GPU资源在不同任务之间的分时共享,推高了集群资源的利用率,降低了用户的等待时间。

    一种模型测试方法、系统、介质及电子设备

    公开(公告)号:CN117076335A

    公开(公告)日:2023-11-17

    申请号:CN202311343167.3

    申请日:2023-10-17

    Applicant: 北京大学

    Abstract: 本申请公开了一种模型测试方法、系统、介质及电子设备,方法包括:获取待测试模型的模型名称以及数据信息;根据数据信息和预先建立的数据管理器,确定待测试模型所需的测试数据集;根据模型名称和预先建立的服务管理器,确定待测试模型对应的目标测试服务组件;根据测试数据集以及目标测试服务组件进行测试,生成待测试模型的测试结果,并反馈至客户端进行展示。由于本申请通过预先建立的数据管理器和服务管理器分别对不同模型的测试数据集和测试服务组件进行统一管理,因此实际应用中在确定模型的模型名称以及数据信息的情况下,可自动化执行模型测试流程,从而简化了模型测试复杂度,提高了模型测试的复用性和灵活性,提升了模型测试效率。

    一种基于代码融合的编译优化方法、系统及电子设备

    公开(公告)号:CN116185426B

    公开(公告)日:2023-09-19

    申请号:CN202310402545.4

    申请日:2023-04-17

    Applicant: 北京大学

    Abstract: 本申请涉及一种基于代码融合的编译优化方法、系统及电子设备。所述方法包括:针对包含有主机代码和内核代码的异构源程序,分别用编译器对主机代码和内核代码进行编译,得到分别与主机代码和内核代码对应的第一中间表示和第二中间表示;基于第一中间表示依次创建主机代码的控制流图和数据流图,基于第二中间表示依次创建内核代码的控制流图和数据流图;将主机代码的控制流图和内核代码的控制流图融合,将主机代码的数据流图和内核代码的数据流图融合,得到异构源程序的全局细粒度依赖关系图;针对异构源程序的全局细粒度依赖关系图中的多个内核节点,将多个内核节点融合。本申请将多个内核节点融合,大幅提升了编译性能。

    一种算子检测方法、装置以及计算机设备

    公开(公告)号:CN116629330A

    公开(公告)日:2023-08-22

    申请号:CN202310451059.1

    申请日:2023-04-24

    Applicant: 北京大学

    Abstract: 本公开提供了一种算子检测方法、装置以及计算机设备,其中,该方法包括:获取神经网络模型的模型文件;基于所述模型文件确定神经网络模型中各网络层的结构描述信息;对每个所述网络层的结构描述信息进行遍历,得到每个所述网络层的算子信息,并基于每个所述网络层的算子信息生成目标算子列表;所述算子信息用于指示各网络层中算子的属性信息和算子之间的依赖关系;对所述目标算子列表进行检查,得到检查结果;通过所述检查结果确定能够通过所述神经网络模型的硬件设备执行相应计算操作的算子。

    算子的自动检测方法、装置、电子设备及介质

    公开(公告)号:CN115934346A

    公开(公告)日:2023-04-07

    申请号:CN202211689392.8

    申请日:2022-12-28

    Applicant: 北京大学

    Abstract: 本申请公开了一种算子的自动检测方法、装置、电子设备及介质。通过应用本申请的技术方案,可以实现一种能够对待检测算子在不同计算设备下的算子支撑能力的自动测试。通过待检测算子在计算精度、计算效率与标准结果的能力对比来获得算子在不同场景下的计算能力判断。从而达到避免相关技术中出现的,无法为不同硬件设备或不同应用功能应用所需算子的问题。

    基于弱监督信息的深度学习图像目标映射及定位方法

    公开(公告)号:CN108764292B

    公开(公告)日:2022-03-18

    申请号:CN201810390879.3

    申请日:2018-04-27

    Applicant: 北京大学

    Abstract: 本发明提供了一种基于弱监督信息的深度学习图像目标映射及定位方法。该方法包括:使用带有类别标签的图像数据分别训练两个深度卷积神经网络框架,得到分类模型M1和分类模型M2,并获取全局带参可学习池化层参数;使用新的分类模型M2对测试图像进行特征提取,得到特征图,根据特征图通过特征类别映射及阈值法得到初步定位框;使用选择性搜索方法对测试图像进行候选区域提取,使用分类模型M1筛选类别出候选框集合;对初步定位框和候选框进行非极大值抑制处理,得到测试图像最终的目标定位框。本发明引入全局带参可学习池化层,能够学习得到关于目标类别j的更好的特征表达,并通过使用选择性特征类别映射的方式,有效得到图像中目标物体的位置信息。

    一种基于支持点学习的开集类别发掘方法与装置

    公开(公告)号:CN110807467A

    公开(公告)日:2020-02-18

    申请号:CN201910882778.2

    申请日:2019-09-18

    Applicant: 北京大学

    Abstract: 本发明涉及深度学习领域,特别涉及一种基于支持点学习的开集类别发掘方法与装置。包括:将样本输入训练好的深度神经网络获得样本特征,计算样本特征与每个类别的支持点集的距离,根据分类阈值和最大距离确定样本为未知样本或已定义样本,如果是已定义类别样本,对样本进行分类,如果是未知样本,对样本进行拒绝。本发明解决如今开集识别训练阶段不能引入未知信息的问题。

    一种支持多视点视频合成的网络流媒体播放器及方法

    公开(公告)号:CN101047848A

    公开(公告)日:2007-10-03

    申请号:CN200710098823.2

    申请日:2007-04-27

    Applicant: 北京大学

    Abstract: 本发明涉及一种支持多视点视频合成的网络流媒体播放器,它包括一个数据接收模块和一个呈现模块,其特征在于:它还包括一个以上解码模块和一个合成模块;所述数据接收模块通过一条以上IP连接接收压缩视频码流,并将所接收数据向一个以上解码模块转发,此外它还从用户界面接收视点切换命令并向合成模块转发;所述解码模块从数据接收模块接收压缩视频帧数据并解码,并向合成模块转发解码后的原始视频帧数据;所述合成模块从一个以上解码模块接收原始视频帧数据并进行虚拟视合成,另一方面将合成结果向呈现模块转发,此外它还从数据接收模块接收视点切换命令;所述呈现模块从合成模块接收虚拟视频帧并向显示设备进行转发。本发明能够在一个播放器框架下同时与流媒体服务器建立多条网络连接并同时接收和解码多个视频码流。

    模型测试方法和系统
    10.
    发明授权

    公开(公告)号:CN117407299B

    公开(公告)日:2024-05-07

    申请号:CN202311350449.6

    申请日:2023-10-18

    Applicant: 北京大学

    Abstract: 本申请涉及人工智能技术领域,具体提供一种模型测试方法,旨在解决面对不同测试需求时会有大量繁杂重复的工作,测试效率低下的问题。为此目的,本申请的模型测试方法应用于服务端,包括:接收客户端发送的待测模型文件、测试数据信息、待测模型的硬件设备参数和测试参数;基于待测模型文件、硬件设备参数和测试参数,生成待测模型;基于测试数据信息,对待测模型进行测试,得到测试结果;向客户端发送测试结果。通过上述方法,能够将测试用户与支持模型运行的硬件完全隔离,并能自动生成测试所需的代码模板和测试服务,极大地提高了测试用户对待测模型测试地易用性,减少了测试人员的工作量,提高测试效率。

Patent Agency Ranking