一种基于跨模态大语言模型的场景文本检测与识别方法

    公开(公告)号:CN117851883B

    公开(公告)日:2024-08-30

    申请号:CN202410006211.X

    申请日:2024-01-03

    Abstract: 本发明公开了一种基于跨模态大语言模型的场景文本检测与识别方法,该方法包括:获取多组具有真值标注的图像‑文本数据集;利用图像编码器对数据集中的图像进行特征提取与学习,得到图像模态的特征嵌入;将图像模态特征嵌入与对应真值标注的文本特征嵌入融合构造为图像及自然语言的多模态特征序列;将融合后的多模态特征序列输入大语言模型当中进行跨模态编解码,再进行自回归机制下的网络微调;将文本图像输入上述训练好的图像编码器与大语言模型当中,通过线性分类与类目查表的方式将网络输出翻译为当前图片当中所包含的文本目标的内容及位置,从而完成文本检测与识别任务。本发明实现方法简便,灵活鲁棒,适用范围广。

    一种基于公式学习的大模型微调方法、装置及存储介质

    公开(公告)号:CN118378592B

    公开(公告)日:2024-08-16

    申请号:CN202410803845.8

    申请日:2024-06-20

    Abstract: 本说明书公开了一种基于公式学习的大模型微调方法、装置及存储介质,获取包含公式的原始文本中的公式和公式的候选变量。针对每个公式,根据该公式的上下文内容,确定目标文本并确定目标文本中的候选变量,在该公式中确定与候选变量一致的匹配变量,根据包含候选变量的语句确定解释文本。将目标文本的解释文本和匹配变量屏蔽,得到任务文本,根据公式和解释文本确定任务文本的标注。将任务文本和任务提示输入大模型得到预测文本,根据预测文本与标注的差异微调大模型。通过屏蔽目标文本的解释文本和匹配变量,对大模型进行微调,使大模型学习到公式中的变量与其解释之间的对应关系,从而在问答任务中提高大模型对涉及公式计算问题的回答准确率。

    基于图像表型匹配的大豆表型识别方法、电子设备、介质

    公开(公告)号:CN118279610A

    公开(公告)日:2024-07-02

    申请号:CN202410704308.8

    申请日:2024-06-03

    Abstract: 本发明公开了一种基于图像表型匹配的大豆表型识别方法、电子设备、介质,包括:获取待识别的大豆图片;将其输入至预先训练好的图像编码器中提取得到图像特征,将图像特征输入至预先训练好的表型解码器中得到大豆图片获得表型结果;其中,图像编码器以及表型解码器的训练过程包括:获取大豆成熟期图像并对其设置表型标签和数组标签;将大豆成熟期图像及其对应的表型标签分别输入至图像编码器、表型编码器,从而训练图像编码器、表型编码器;固定表型编码器的网络权重;将表型标签输入至表型编码器提取得到表型特征,将表型特征输入至表型解码器提取得到表型结果识别特征,基于表型结果识别特征与数组标签间的差值从而反向传播优化表型解码器。

    一种身份识别模型的训练方法、装置、介质及电子设备

    公开(公告)号:CN117349725A

    公开(公告)日:2024-01-05

    申请号:CN202311280581.4

    申请日:2023-09-28

    Abstract: 本说明书公开了一种身份识别模型的训练方法、装置、介质及电子设备,包括:确定历史上采集到的用户的PPG信号作为训练样本,以及确定用户的身份标识作为训练样本对应的标注。确定历史上采集到的用户的心电ECG信号为第一心电信号,并确定第一心电信号的特征为训练样本的第一伪标注。将训练样本输入待训练的身份识别模型的特征提取层,确定训练样本对应的特征为第一特征,将第一特征输入待训练的身份识别模型的识别层,确定训练样本的识别结果。根据第一特征、识别结果、标注以及第一伪标注,至少对待训练的身份识别模型的特征提取层进行训练,避免受限于PPG信号的敏感性造成的身份识别准确率低的问题,提高了用户身份识别的准确性。

    一种基于物联网聚合中心系统的设备运行控制方法和装置

    公开(公告)号:CN117119002A

    公开(公告)日:2023-11-24

    申请号:CN202310922611.0

    申请日:2023-07-26

    Abstract: 本发明公开了一种基于物联网聚合中心系统的设备运行控制方法和装置,该方法首先创建一个聚合人、空间、设备全数据的物联网聚合中心系统,并将空间与设备进行关联;然后物联网聚合中心系统根据使用人信息自动将空间关联的设备的设备数据关联到使用人;其次使用人登录物联网聚合中心系统后,获取归属设备信息和实时设备数据以及设备的控制命令;最后根据使用人的归属设备信息和实时设备数据以及设备的控制命令在低代码模块界面建立设备运行的逻辑规则,根据控制命令控制使用人的归属设备按照逻辑规则运行。本发明将人、空间和设备全数据聚合到一起创建了物联网聚合中心系统,本发明通过低代码模块能够自定义建立逻辑规则,有利于增强适用性。

Patent Agency Ranking