-
公开(公告)号:CN118446230B
公开(公告)日:2024-09-27
申请号:CN202410875580.2
申请日:2024-07-02
IPC分类号: G06F40/35 , G06F40/284 , G06N3/0455 , G06N3/08
摘要: 本发明公开了一种捕捉情感支持对话中动态因果关系的方法,涉及人工智能技术领域,将对话历史输送到因果网络模型中,以生成与当前语境相关的情感支持回复;所述因果网络模型包括上下文编码器、多线索因果追踪模块、三源信息融合模块和语境感知生成器;该捕捉情感支持对话中动态因果关系的方法从因果关系的角度探索对话流,有助于挖掘语境中隐藏的线索,并使支持者更好地理解求助者正在发生的事情,这件事为什么会发生以及事件的影响是什么,从而促进与语境相关的情感支持的回复生成。
-
公开(公告)号:CN118410131B
公开(公告)日:2024-09-03
申请号:CN202410879337.8
申请日:2024-07-02
IPC分类号: G06F16/33 , G06F40/16 , G06F40/30 , G06N3/0455
摘要: 本发明公开了一种基于多线索提示学习的情感支持对话生成方法,涉及人工智能技术领域,将用户的情感原因输入到情感模型中,以得到情感回复结果;所述情感模型的训练过程如下:S1:构建训练集,所述训练集包括多组历史对话以及分别与多组历史对话对应的情感原因;S2:提取历史对话和情感原因对应的线索;S3:基于历史对话和情感原因对应的线索构建语义增强提示和语义约束提示;S4:将语义增强提示和历史对话结合后与语义约束提示作为回复生成器模块的输入,基于所生成的情感支持回复训练调整情感模型,直至情感模型收敛;该情感支持对话生成方法提高了情感回复的多样化以及准确度。
-
公开(公告)号:CN113822181B
公开(公告)日:2024-05-24
申请号:CN202111050931.9
申请日:2021-09-08
IPC分类号: G06V20/40 , G06V10/774 , G06V10/764 , G06F17/10 , G06F17/16
摘要: 本发明公开了一种基于肢体活跃度的行为心理异常检测方法,属于计算机视觉技术领域,包括采集待预测个体在时间段T内的视频数据;基于时间段T内的视频数据,计算整段视频数据的身体活跃度,将待预测个体ID、时间段T以及对应的身体活跃度组成待预测数据项;将待预测数据项作为预先构建的身体活跃度异常等级预测模型,预测所述待预测个体的身体活跃度异常等级。本发明以人体关键点识别深度学习模型为基础,对所需要监测的人员进行长时间观测,建立身体活跃度异常等级预测模型,对需要监测人员以后的行为进行监测,根据模型判断哪些行为存在异常,达到提前预警、防止危害发生的目的。
-
公开(公告)号:CN118051633A
公开(公告)日:2024-05-17
申请号:CN202410148559.2
申请日:2024-02-01
摘要: 本发明涉及跨模态检索技术领域,公开了一种基于长短映射的跨模态哈希检索方法,包括以下步骤:建立多模态数据集,多模态数据集中包括多个由图像以及对应的文本描述组成的图像文本描述对;构建长短映射方法;构建检索模型;哈希检索;本发明通过深度学习提取多维度特征,依据多维度特征之间的相关性差异实现不同维度特征之间的映射以增强低维特征的表现能力并提升检索准确率。
-
公开(公告)号:CN118038139A
公开(公告)日:2024-05-14
申请号:CN202410129619.6
申请日:2024-01-30
摘要: 本发明涉及计算机视觉技术领域,公开了一种基于大模型微调的多模态小样本图像分类方法,包括:图像文本对的预处理;多模态特征的提取;构建基于CLIP大模型微调的多模态小样本分类模型;类别预测:将测试图像输入到完成训练的分类模型的图像编码器后,得到图像特征,利用余弦分类器,对图像特征与类原型字典中的所有多模态特征的余弦相似度进行计算,相似度最高的多模态特征所述的类别,即为测试图像的预测类别。本发明在视觉‑语言大模型的基础之上,迁移大模型中丰富的多模态信息到特定的图像分类任务上,既通过大模型蕴含的丰富知识来补充数据不足的问题,又充分挖掘图像数据的信息,以实现更加高效的小样本图像分类方法。
-
公开(公告)号:CN116071759B
公开(公告)日:2023-07-18
申请号:CN202310202217.X
申请日:2023-03-06
IPC分类号: G06V30/19 , G06F40/289 , G06V10/82 , G06N3/0442 , G06N3/0455
摘要: 本发明涉及计算机视觉技术领域,公开了一种融合GPT2预训练大模型的光学字符识别方法,将待识别的文本图像输入到光学字符识别模型,得到与文本图像对应的文本;光学字符识别模型的训练方法包括:对文本数据进行预处理后,将文本转化为文本图像,对文本图像进行数据增广,得到文本图像数据集;抽取文本图像的特征矢量:将特征矢量输入到基于预训练的GPT‑2模型的文本解码模块,预测生成相应的文本;将GPT‑2模型的参数冻结,利用CTC损失函数优化文本图像编码模块的参数,再对光学字符识别模型的参数进行微调;本发明能够利用GPT2模型对于文本字符关系的建模能力提高OCR识别的准确率。
-
公开(公告)号:CN115861663B
公开(公告)日:2023-05-23
申请号:CN202310185709.2
申请日:2023-03-01
IPC分类号: G06V10/74 , G06V30/418 , G06V10/82 , G06N3/0464 , G06N3/0895
摘要: 本发明涉及计算机视觉技术领域,公开了一种基于自监督学习模型的文档图像内容比对方法,包括以下步骤:将纸质文档转化为扫描版图像,电子文档转化为电子版图像;提取扫描版图像和电子版图像中的字符图像并依次排序,分别形成扫描字符图像序列和电子字符图像序列;将扫描字符图像序列和电子字符图像序列输入至文字比对自监督模型的编码器中,分别得到扫描图像编码序列和电子图像编码序列;计算扫描图像编码序列和电子图像编码序列相同位置i上的两个元素的余弦相似度,当余弦相似度小于设定的阈值时,则认为电子文档位置i处的内容被篡改。本发明不需要检测图像中每个字符的具体内容完成比对,能够提高比对的效率。
-
公开(公告)号:CN115934933A
公开(公告)日:2023-04-07
申请号:CN202310223422.4
申请日:2023-03-09
IPC分类号: G06F16/34 , G06N3/0455 , G06N3/08
摘要: 本发明提供一种基于双端对比学习的文本摘要生成方法和系统,涉及文本摘要生成技术领域。本发明从整体(编码器端和解码器端)提高基于Seq2Seq的文本摘要模型生成高质量摘要的能力;包括:在编码器端,根据所述训练集中的输入文本,获取第一正负样例对,并构建第一损失函数,即利用对比学习增强编码器的编码能力;在解码器端,根据所述训练集中的输入文本和参考摘要,获取第二正负样例对,并构建第二损失函数,即利用对比学习缓解模型的曝光偏差;根据第一、二损失函数,并在所述解码器端引入交叉熵损失函数,构建总损失函数;根据所述总损失函数,对模型进行联合训练直至收敛,并且以单阶段完成,增加模型训练和推理效率。
-
公开(公告)号:CN113191214A
公开(公告)日:2021-07-30
申请号:CN202110390322.1
申请日:2021-04-12
摘要: 本发明公开了一种驾驶人员失误操作风险预警方法及系统,属于智能驾驶技术领域,包括:获取待测驾驶人员的实时驾驶视频作为待测数据;对待测数据进行分析,得到预测变量,并将预测变量转换为对应的预测向量;将预测向量作为预先训练好的风险预警模型的输入,得到该待测驾驶人员的风险预警结果。本发明不仅考虑认知负荷对失误操作的影响,还增加了动作协调度、负面情绪变量的作用,将失误操作的风险因素考虑更加齐全,极大地提升了对失误操作的风险预测能力和预测准确率。
-
公开(公告)号:CN113191212A
公开(公告)日:2021-07-30
申请号:CN202110388686.6
申请日:2021-04-12
摘要: 本发明公开了一种驾驶员路怒风险预警方法及系统,属于智能驾驶辅助技术领域,包括:获取待测驾驶人员的实时驾驶状态数据,该状态数据包括面部活动数据、头部姿态数据、肢体动作数据以及心率数据;将状态数据在情绪变化时间长度最小区间内进行融合,得到融合数据;将融合数据作为预先训练好的路怒等级识别时间序列模型的输入,得到该驾驶人员的路怒风险等级。本发明可在驾驶期间内,持续检测并预警驾驶人员危险驾驶风险情绪,能够在驾驶员发生路怒状态前提前预警,提示驾驶员进行自我情绪调节。
-
-
-
-
-
-
-
-
-