具有视觉语义感知的机器人虚实交互操作执行系统及方法

    公开(公告)号:CN109910018B

    公开(公告)日:2024-01-30

    申请号:CN201910343004.2

    申请日:2019-04-26

    Abstract: 本发明公开了一种具有视觉语义感知的机器人虚实交互操作执行系统及方法,其中,该系统包括:构建组件用于构建真实环境或仿真环境确定相应的神经网络参数模型;视觉语义感知组件用于根据神经网络参数模型确定待抓取物体的感兴趣区域,以计算抓取感兴趣区域的目标点位信息;规划组件用于根据目标点位信息对待抓取物体进行避障和轨迹规划,确定抓取执行操作命令;执行组件用于根据抓取执行操作命令控制真实机械臂或仿真机械臂的动作,完成抓取操作命令。该系统可用于机器人系统的快速原型开发,算法测试,精确的室内室外环境仿真,有效可靠的性能评估,以及直观可视化的交互显示。

    基于自我认知的模型推理方法、装置及电子设备

    公开(公告)号:CN116822633A

    公开(公告)日:2023-09-29

    申请号:CN202311111582.6

    申请日:2023-08-31

    Applicant: 清华大学

    Abstract: 本发明涉及人工智技术领域,提供一种基于自我认知的模型推理方法、装置及电子设备,其中的方法包括:接收用户端的待解答问题;基于待解答问题,获取语言大模型的自我认知结果;根据自我认知结果,推理得到待解答问题的答案。该方法通过引入语言大模型的自我认知,根据语言大模型的自我认知情况,采用不同的推理模式对用户端的待解答问题进行推理,避免了单独通过语言大模型或检索增强进行推理而带来的模型推理准确度不高的情况,能够根据语言大模型的实际推理情况,适用最合适的推理模式,得到更准确的推理结果,有效提升了模型推理的准确度,也进一步提升了用户端的体验感。

    用于目标检测的宽动态实现方法、装置、相机及存储介质

    公开(公告)号:CN116647760A

    公开(公告)日:2023-08-25

    申请号:CN202310899704.6

    申请日:2023-07-21

    Applicant: 清华大学

    Abstract: 本发明涉及成像及图像处理技术领域,提供一种用于目标检测的宽动态实现方法、装置、相机及存储介质,其中的方法包括:接收图像传感器转发的待检测图像;计算待检测图像的全图亮度均值和分区亮度均值,并确定后续一帧或多帧待检测图像的曝光参数;根据后续一帧或多帧待检测图像的曝光参数,获取后续一帧或多帧待检测图像;在每次获取目标图像后执行目标检测步骤,得到目标检测结果。该方法根据图像的全图亮度均值和分区亮度均值,动态调整图像曝光参数,针对类似强光源下的高亮以及阴影、逆光等环境,可以采集到更多的亮度信息,得到图像中更多的细节信息,且该过程不需要做图像融合,也不需要缓存图像,实现了图像中目标的快速、准确检测。

    一种基于六维力信号的机器人遥操作方法和装置

    公开(公告)号:CN114310974B

    公开(公告)日:2023-08-25

    申请号:CN202111517093.1

    申请日:2021-12-08

    Applicant: 清华大学

    Abstract: 本发明公开了一种基于六维力信号的机器人遥操作方法和装置,其中,该方法包括:使用遥控器采集遥操作六维力信号,其中遥控器至少包含力矩传感器;利用滤波算法对六维力信号进行滤波;对过滤后的六维力信号进行限幅处理,求得机器人在笛卡尔空间中的末端速度,以及计算求得机器人的关节角速度;根据控制器实时系统的指令下发周期,结合当前机器人的关节位置,将关节角速度积分计算得到关节期望位置,下发给各关节驱动器,各关节驱动器通过位置控制的方式,实现对机器人的遥操作。本发明利用六维力信号直接对应机器人末端在笛卡尔空间中的位姿,操作机器人的移动,对力信号有抗干扰和限幅的作用,且可以对遥操作调速,使遥操作更稳定、简单和直观。

    一种弱监督视觉语言预训练模型的训练方法和装置

    公开(公告)号:CN116167434A

    公开(公告)日:2023-05-26

    申请号:CN202310445450.0

    申请日:2023-04-24

    Applicant: 清华大学

    Abstract: 本发明提供一种弱监督视觉语言预训练模型的训练方法和装置,包括:选定若干个对齐的图文对,并将每一个图文对作为一个图文锚点对;基于图片数据集/文本数据集中每一个图片/文本与每一个图片锚点/文本锚点的相似度,确定图片数据集/文本数据集中每一个图片/文本的相对表征;根据图片数据集中每一个图片的相对表征和文本数据集中每一个文本的相对表征,构建伪平行图文数据集;利用伪平行图文数据集训练视觉语言预训练模型。本发明使用相对表征来作为图片和文本的统一表示,在相对表征的基础上构建高质量的伪平行数据,并利用伪平行数据训练的弱监督视觉语言预训练模型,以使模型具有更强跨模态理解能力。

    一种机器翻译模型的知识学习方法和装置

    公开(公告)号:CN115511078A

    公开(公告)日:2022-12-23

    申请号:CN202211204260.1

    申请日:2022-09-29

    Applicant: 清华大学

    Abstract: 本发明提供一种机器翻译模型的知识学习方法和装置,包括:构建迁移数据集;分别利用机器翻译教师模型和机器翻译学生模型翻译迁移数据集每一条样本的原文,得到迁移数据集每一条样本的第一候选词概率分布和第二候选词概率分布;根据迁移数据集每一条样本的第一候选词概率分布、第二候选词概率分布以及标准候选词概率分布,确定迁移数据集每一条样本的迁移损失;基于迁移数据集每一条样本的第一候选词概率分布和迁移损失,实现机器翻译学生模型对机器翻译教师模型的知识学习。本发明通过迁移损失,使机器翻译学生模型从机器翻译教师模型中学习到互补性知识,实现机器翻译学生模型的知识累积,进而提升机器翻译学生模型的翻译性能。

    一种基于网络资源的医学问题问答处理方法及装置

    公开(公告)号:CN114780672A

    公开(公告)日:2022-07-22

    申请号:CN202210295494.5

    申请日:2022-03-23

    Abstract: 本发明提供一种基于网络资源的医学问题问答处理方法及装置。该方法包括:确定用户输入的医学问题信息,并对医学问题信息进行关键词提取及扩展处理,得到扩展后的关键词集合;利用基于词频逆文档频率的统计方式及关键词集合,从文档库中检索出与关键词集合对应的目标问答文档;基于预训练语言模型和医学问题信息对目标问答文档进行重排序,输出重排序后的问答结果;预训练语言模型是基于通用领域样本数据、医学问答领域数据组成的混合数据集及相应的评分指标为预训练样本对初始掩码语言模型进行训练得到的。本发明提供的方法,通过基于词频逆文档频率的统计方式进行筛选并利用预训练语言模型重排序,能够有效提高医学问题问答匹配的精度和效率。

    高速高精度并联机器人
    40.
    发明授权

    公开(公告)号:CN111168649B

    公开(公告)日:2021-04-27

    申请号:CN202010018625.6

    申请日:2020-01-08

    Applicant: 清华大学

    Abstract: 本发明公开了一种高速高精度并联机器人,包括定平台、多个驱动装置、动平台部件和多组支链组。每个驱动装置包括一个主动臂和驱动单元,驱动单元围绕定平台设置。动平台部件包括多个连接部。每组支链组包括第一支链臂和第二支链臂,第一支链臂分别通过第一虎克铰、第二虎克铰与主动臂、对应的连接部相连,第一虎克铰包括垂直相连的第一转动副和第二转动副,第二虎克铰包括垂直相连的第三转动副和第四转动副。第二支链臂分别通过第三虎克铰、第四虎克铰与主动臂、对应的连接部相连,第三虎克铰包括垂直相连的第五转动副和第六转动副,第四虎克铰包括垂直相连的第七转动副和第八转动副。根据本发明的高速高精度并联机器人,可以提升刚度和作业精度。

Patent Agency Ranking