基于Caffe的卷积神经网络在FPGA上的部署方法

    公开(公告)号:CN111931913A

    公开(公告)日:2020-11-13

    申请号:CN202010793360.7

    申请日:2020-08-10

    Abstract: 本发明提出了一种基于Caffe的卷积神经网络在FPGA上的部署方法,用于解决现有技术存在的时间消耗大、部署时间长和实际应用性差的问题,实现步骤为:获取训练样本集;基于Caffe构建卷积神经网络模型C;基于Caffe对卷积神经网络模型C进行训练;基于Caffe提取训练好的卷积神经网络模型C*的参数并存储;基于verilog建立卷积神经网络C**;获取卷积神经网络在FPGA上的部署结果。本发明利用Caffe的函数建立了易于控制的卷积神经网络模型,提升了卷积神经网络在FPGA上部署的速度,并且设计了参数配置时的映射操作,让卷积神经网络能够顺利部署。

    一种基于超体素的点云数据分割方法

    公开(公告)号:CN106600622B

    公开(公告)日:2019-11-08

    申请号:CN201611111975.7

    申请日:2016-12-06

    Abstract: 本发明公开了一种基于超体素的点云数据分割方法,通过考虑点云数据的三维几何关系和区域连通性,利用聚类的方法将点云数据进行过分割,得到依附于目标边界的超体素;计算超体素数据平面拟合的残差值,依该值对其进行排序和筛选得到有效的种子超体素,并利用法线分布直方图、测地距离和欧式距离的差值进行区域增长,最终实现对点云数据的分割处理。以室内局部场景的点云数据作为输入,通过利用超体素和区域增长算法实现点云数据的精确分割。本发明与传统的点云分割方法相比,在保证分割效率的前提下,避免了直接处理点云数据所导致的欠分割和过分割问题,得到具有精确边界信息的分割结果,而且分割方法对点云数据的采样密度和噪音是健壮的。

    基于虚拟现实的文化学习系统及方法

    公开(公告)号:CN110264826A

    公开(公告)日:2019-09-20

    申请号:CN201910500480.0

    申请日:2019-06-11

    Abstract: 本发明提出了一种基于虚拟现实的文化学习系统及方法,用于解决现有技术中存在的学习环境交互性差,文化学习范围单一且未能提供综合学习结果的技术问题,学习系统包括场景构建模块、学习测试模块、交互学习模块和结果输出模块,学习方法为:场景构建模块构建文化知识学习场景和文化技能学习场景;学习测试模块检测用户在学习前后对文化知识学习和文化技能学习的掌握情况;用户使用交互学习模块的虚拟现实设备在文化知识学习场景中学习语言交际知识和文化背景知识,并在文化技能学习场景中学习文化习俗行为;结果输出模块根据学习测试模块的结果计算学习得分获取综合学习结果并输出。本发明可用于在虚拟现实环境中学习文化。

    一种基于多幅未标定图像的三维点云重建方法

    公开(公告)号:CN106600686A

    公开(公告)日:2017-04-26

    申请号:CN201611111611.9

    申请日:2016-12-06

    Abstract: 本发明公开了一种基于多幅未标定图像的三维点云重建方法,获取物体在不同角度拍摄的图像序列作为输入集合;通过特征提取和匹配得到图像的特征匹配点对,进行稠密扩散处理;选择候选图像的特征点作为种子点向其周围邻域进行匹配扩散并过滤,获得稠密匹配点对;对相机进行标定,结合匹配点对得到其内外参数;根据相机参数及匹配点对恢复出三维模型点;进行重建,选取种子模型点生成初始patch,并在其网格邻域内扩散得到稠密的patch;根据约束条件过滤误差patch,获得精确的稠密三维点云模型。本发明可以快速获得高精度的稠密点云模型,加快模型的生成速度,增加了匹配的稠密性的准确性,增加了三维点云的稠密性和准确性。

    多模态融合的大脑视觉神经活动表征的对齐方法

    公开(公告)号:CN118551337A

    公开(公告)日:2024-08-27

    申请号:CN202410632522.7

    申请日:2024-05-21

    Abstract: 本发明公开了一种多模态融合的大脑视觉神经活动表征的对齐方法,属于生物医学工程和模式识别交叉领域。本发明基于观看大量视觉感知图像下的功能核磁共振图像信号数据构建的多模态融合的大脑视觉刺激表征对齐模型,其主要包括视觉刺激语义融合模块,一个VAE模型负责融合目标多模态的语义表征信息,包括图像、文本;大脑语义信息编码器,一个GRU负责提取大脑主要视觉皮层的语义信息,经过CLIP式的对比学习将二者对齐到统一特征空间。本发明解决视觉活动同时对齐图像和文本时产生的对齐模糊问题,是提取语义增强的视觉特征的关键,以提取丰富语义信息的识别表征,为后续的脑解码研究提供了有价值的基础。

    一种基于GPT的多任务视觉感知解码方法

    公开(公告)号:CN118427767A

    公开(公告)日:2024-08-02

    申请号:CN202410145024.X

    申请日:2024-02-01

    Abstract: 本发明公开了一种基于GPT的多任务视觉感知解码方法,属于生物医学图像脑解码中的语言解码技术领域。本发明基于观看大量视觉感知图像下的功能磁共振信号数据建立基于GPT模型的语言解码模型,其包括:Prompt嵌入模块,将包含任务信息的Prompt嵌入到隐特征空间;视觉编码模块,使用GRU将视觉相关区域体素信号编码到隐特征空间;网络编码模块,将视觉相关区域体素信号作为上下文,指导大脑所有其他区域的体素信号的选取,并将全局信息编码到隐特征空间;语言生成模块,融合隐特征并识别隐特征以进行对应内容的文本生成。本发明解决了在一个解码模型中无法进行多个解码任务的问题,并引入了大脑的有效全局信息,可以实现多任务语言生成式脑机接口场景的实际应用。

Patent Agency Ranking