Patent search ap:("中国科学院计算技术研究所") AND inv:"唐乾坤" Page 1

1.

发明授权
一种用于轻量级目标检测的特征提取方法及相应检测方法有权

公开(公告)号：CN111461211B

公开(公告)日：2023-07-21

申请号：CN202010243255.6

申请日：2020-03-31

Applicant: 中国科学院计算技术研究所

Inventor： 唐乾坤 , 李洁 , 胡瑜

IPC: G06V10/80 , G06V10/82 , G06V10/44 , G06V10/764 , G06V10/766

Abstract: 本发明提供一种轻量级的目标检测方法与装置。本发明的轻量级的目标检测方法包括：步骤S1：对目标图片进行特征提取以获取至少包含图像底层信息的图像特征，并至少部分保留所述底层信息对图像特征进行降维和卷积操作；步骤S2：对处理后的图像特征进行高层语义信息提取；步骤S3：将网络中前后特征图大小不同的临近层进行自适应融合；步骤S4：对融合后的信息进行分类和回归，获得目标检测结果。本发明方法能够提取和保留更多的底层细节信息，有助于目标的正确地定位、提高检测精度。并且，本发明的检测方法相比于相应技术计算量更小、消耗的存储量更少，能够保存更多底层信息。

2.

发明授权
一种基于卷积神经网络的目标检测方法和系统有权

公开(公告)号：CN109583483B

公开(公告)日：2020-12-11

申请号：CN201811347546.9

申请日：2018-11-13

Applicant: 中国科学院计算技术研究所

Inventor： 唐乾坤 , 胡瑜 , 金贝贝 , 曾一鸣 , 刘世策 , 叶靖

IPC: G06K9/62

Abstract: 本发明涉及一种基于卷积神经网络的目标检测方法和系统，包括：使用多种尺度的卷积核分别提取待测图片的卷积特征图；使用全连接层调节卷积特征图每一个空间位置的特征向量，得到第一特征图，将其拼接得到拼接特征图，使用全连接层调节拼接特征图每个通道的特征信息，得到第二特征图；为第二特征图的每个空间位置上设定不同尺度和长宽比的锚点框，锚点框的坐标和大小是相对于待测图片的坐标系；将每个锚点框投影到第二特征图上，使用区域特征提取操作提取投影之后锚点框内部的特征，并将框选有物体的锚点框作为目标候选框；使用目标识别网络对目标候选框中的物体进行分类以及回归目标候选框的准确位置和大小。

3.

发明授权
一种基于卷积神经网络进行目标检测的方法有权

公开(公告)号：CN111461145B

公开(公告)日：2023-04-18

申请号：CN202010244313.7

申请日：2020-03-31

Applicant: 中国科学院计算技术研究所

Inventor： 唐乾坤 , 胡瑜

IPC: G06V10/764 , G06V10/766 , G06V10/80 , G06V10/44 , G06V10/82 , G06N3/0464 , G06N3/047

Abstract: 本发明提供一种基于卷积神经网络进行的目标检测方法，包括：提取特征图并设置若干不同的预设框；将所述预设框进行回归以调整其位置和大小；基于所述回归后的预设框提取其对应的局部卷积特征；将所述局部卷积特征输入卷积预测器进行分类和回归，获得目标的边界框位置和目标的类别，其中，所述卷积预测器是通过将所述预设框进行分类并选择正例预设框来训练获得。

4.

发明公开
一种单目图像深度估计方法与系统有权

公开(公告)号：CN107204010A

公开(公告)日：2017-09-26

申请号：CN201710293908.X

申请日：2017-04-28

Applicant: 中国科学院计算技术研究所

Inventor： 曾一鸣 , 胡瑜 , 刘世策 , 唐乾坤 , 李晓维

IPC: G06T7/55 , G06K9/62 , G06N3/04

Abstract: 本发明涉及单目图像深度估计方法和系统，包括：构建仅具有特征摄取部分的CNN模型架构，作为特征摄取架构；按所需深度图的分辨率设置多个全连接层；将全连接层连接至特征摄取架构，组成初级估计网络模型；使用训练数据集训练初级估计网络模型，并提取初级估计网络模型各层的特征图；计算特征图和其相应深度图的平均相对局部几何结构误差，并根据平均相对局部几何结构误差生成最终估计模型；使用训练数据集并结合损失函数对最终估计模型进行训练，并用训练完成后的最终估计模型对输入图像进行深度预测。本发明根据平均相对局部几何结构误差并基于损失函数训练CNN，进而提高CNN回归深度图像的精度与清晰度，生成的深度图保留了更多场景的几何结构特征。

5.

发明公开
一种基于卷积神经网络进行目标检测的方法有权

公开(公告)号：CN111461145A

公开(公告)日：2020-07-28

申请号：CN202010244313.7

申请日：2020-03-31

Applicant: 中国科学院计算技术研究所

Inventor： 唐乾坤 , 胡瑜

IPC: G06K9/46 , G06K9/62

Abstract: 本发明提供一种基于卷积神经网络进行的目标检测方法，包括：提取特征图并设置若干不同的预设框；将所述预设框进行回归以调整其位置和大小；基于所述回归后的预设框提取其对应的局部卷积特征；将所述局部卷积特征输入卷积预测器进行分类和回归，获得目标的边界框位置和目标的类别，其中，所述卷积预测器是通过将所述预设框进行分类并选择正例预设框来训练获得。

6.

发明授权
一种单目图像深度估计方法与系统有权

公开(公告)号：CN107204010B

公开(公告)日：2019-11-19

申请号：CN201710293908.X

申请日：2017-04-28

Applicant: 中国科学院计算技术研究所

Inventor： 曾一鸣 , 胡瑜 , 刘世策 , 唐乾坤 , 李晓维

IPC: G06T7/55 , G06K9/62 , G06N3/04

Abstract: 本发明涉及单目图像深度估计方法和系统，包括：构建仅具有特征摄取部分的CNN模型架构，作为特征摄取架构；按所需深度图的分辨率设置多个全连接层；将全连接层连接至特征摄取架构，组成初级估计网络模型；使用训练数据集训练初级估计网络模型，并提取初级估计网络模型各层的特征图；计算特征图和其相应深度图的平均相对局部几何结构误差，并根据平均相对局部几何结构误差生成最终估计模型；使用训练数据集并结合损失函数对最终估计模型进行训练，并用训练完成后的最终估计模型对输入图像进行深度预测。本发明根据平均相对局部几何结构误差并基于损失函数训练CNN，进而提高CNN回归深度图像的精度与清晰度，生成的深度图保留了更多场景的几何结构特征。

7.

发明公开
具有可变焦光学摄像头的深度摄像头及其控制方法有权

公开(公告)号：CN107301665A

公开(公告)日：2017-10-27

申请号：CN201710302885.4

申请日：2017-05-03

Applicant: 中国科学院计算技术研究所

Inventor： 胡瑜 , 曾一鸣 , 唐乾坤 , 阚美娜 , 李晓维

IPC: G06T7/564 , H04N5/232

Abstract: 本发明提供一种具有可变焦光学摄像头的深度摄像头及其控制方法，所述方法包括：1)识别由所述深度摄像头所拍摄的光学图像上存在的物体；2)确定该物体的识别置信度；以及3)如果该物体的识别置信度不大于设定阈值，则针对该物体进行光学变焦和或数字变焦，以获得新的光学图像。使用根据本发明的智能深度摄像头，可以自动地、智能地进行变焦，当被拍摄物体的识别准确度比较低时，无需人工干预即可根据物体的尺寸和距离信息进行自动变焦，从而很大程度地提高了物体识别的效果。

8.

发明授权
一种生成用于视频预测的神经网络模型的方法有权

公开(公告)号：CN109168003B

公开(公告)日：2020-11-03

申请号：CN201811024913.1

申请日：2018-09-04

Applicant: 中国科学院计算技术研究所

Inventor： 金贝贝 , 胡瑜 , 曾一鸣 , 唐乾坤 , 刘世策 , 叶靖

IPC: H04N19/503 , H04N19/70 , H04N19/44

Abstract: 本发明提供一种训练用于视频预测的生成器模型G的方法，使得使用该模型可以以较少的计算量获得更好的、长时间的视频预测效果。所述生成器模型G中包括采用神经网络模型结构的编码器与解码器，所述编码器与所述解码器之间采用跳变连接，用于生成预测的帧间差ΔX，所述预测的帧间差ΔX与训练样本求和的结果为预测帧所述方法，包括：1)选择连续的视频帧作为训练样本，并提取训练样本的帧间差；2)将所述帧间差作为生成器模型G中编码器的输入，基于第一损失函数训练获得所述编码器与所述解码器的神经网络权值：其中，ΔXi‑1为与第i个帧间差相关的值，Xi为训练样本中的第i帧，为第i个预测帧，Xi和与所述编码器与所述解码器的神经网络权值相关。

9.

发明授权
具有可变焦光学摄像头的深度摄像头及其控制方法有权

公开(公告)号：CN107301665B

公开(公告)日：2020-03-31

申请号：CN201710302885.4

申请日：2017-05-03

Applicant: 中国科学院计算技术研究所

Inventor： 胡瑜 , 曾一鸣 , 唐乾坤 , 阚美娜 , 李晓维

IPC: G06T7/564 , H04N5/232

Abstract: 本发明提供一种具有可变焦光学摄像头的深度摄像头及其控制方法，所述方法包括：1)识别由所述深度摄像头所拍摄的光学图像上存在的物体；2)确定该物体的识别置信度；以及3)如果该物体的识别置信度不大于设定阈值，则针对该物体进行光学变焦和或数字变焦，以获得新的光学图像。使用根据本发明的智能深度摄像头，可以自动地、智能地进行变焦，当被拍摄物体的识别准确度比较低时，无需人工干预即可根据物体的尺寸和距离信息进行自动变焦，从而很大程度地提高了物体识别的效果。

10.

发明公开
一种语义场景补全系统与方法无效

公开(公告)号：CN109447923A

公开(公告)日：2019-03-08

申请号：CN201811129666.1

申请日：2018-09-27

Applicant: 中国科学院计算技术研究所

Inventor： 刘世策 , 胡瑜 , 曾一鸣 , 唐乾坤 , 金贝贝 , 韩银和 , 李晓维

IPC: G06T5/50 , G06T7/10 , G06N3/04 , G06N3/08

Abstract: 本发明涉及一种语义场景补全方法和系统，包括：获取已标注的彩色图像和深度图像，作为训练数据，其中彩色图像和深度图像已标注语义分割标签和语义场景补全标签；使用训练数据训练卷积神经网络，得到语义分割模型和语义场景补全模型，将待语义场景补全的待补全图像输入至语义分割模型，得到语义分割结果；根据拍摄彩色图像的相机参数和深度图像，得到彩色图像中像素和深度图像中体素的映射关系，根据映射关系将语义分割结果投影到三维空间，得到待补全图像的语义场景表面；对语义场景表面进行离散化处理后输入至语义场景补全模型，得到待补全图像的三维结构和待补全图像中物体的类别，输出三维结构和类别作为待补全图像的语义场景补全结果。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification