专利检索 ap:("合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)") AND inv:"汪萌" 第 1 页

1.

发明授权
一种捕捉情感支持对话中动态因果关系的方法有权

公开(公告)号：CN118446230B

公开(公告)日：2024-09-27

申请号：CN202410875580.2

申请日：2024-07-02

申请人： 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)

发明人： 赵卓尔 , 徐阳阳 , 孙晓 , 汪萌

IPC分类号： G06F40/35 , G06F40/284 , G06N3/0455 , G06N3/08

摘要： 本发明公开了一种捕捉情感支持对话中动态因果关系的方法，涉及人工智能技术领域，将对话历史输送到因果网络模型中，以生成与当前语境相关的情感支持回复；所述因果网络模型包括上下文编码器、多线索因果追踪模块、三源信息融合模块和语境感知生成器；该捕捉情感支持对话中动态因果关系的方法从因果关系的角度探索对话流，有助于挖掘语境中隐藏的线索，并使支持者更好地理解求助者正在发生的事情，这件事为什么会发生以及事件的影响是什么，从而促进与语境相关的情感支持的回复生成。

2.

发明授权
一种基于多线索提示学习的情感支持对话生成方法有权

公开(公告)号：CN118410131B

公开(公告)日：2024-09-03

申请号：CN202410879337.8

申请日：2024-07-02

申请人： 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)

发明人： 徐阳阳 , 赵卓尔 , 孙晓 , 汪萌

IPC分类号： G06F16/33 , G06F40/16 , G06F40/30 , G06N3/0455

摘要： 本发明公开了一种基于多线索提示学习的情感支持对话生成方法，涉及人工智能技术领域，将用户的情感原因输入到情感模型中，以得到情感回复结果；所述情感模型的训练过程如下：S1：构建训练集，所述训练集包括多组历史对话以及分别与多组历史对话对应的情感原因；S2：提取历史对话和情感原因对应的线索；S3：基于历史对话和情感原因对应的线索构建语义增强提示和语义约束提示；S4：将语义增强提示和历史对话结合后与语义约束提示作为回复生成器模块的输入，基于所生成的情感支持回复训练调整情感模型，直至情感模型收敛；该情感支持对话生成方法提高了情感回复的多样化以及准确度。

3.

发明授权
一种基于肢体活跃度的行为心理异常检测方法有权

公开(公告)号：CN113822181B

公开(公告)日：2024-05-24

申请号：CN202111050931.9

申请日：2021-09-08

申请人： 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)

发明人： 黄杰 , 宋京泽 , 孙晓 , 汪萌 , 吴枫 , 康宇

IPC分类号： G06V20/40 , G06V10/774 , G06V10/764 , G06F17/10 , G06F17/16

摘要： 本发明公开了一种基于肢体活跃度的行为心理异常检测方法，属于计算机视觉技术领域，包括采集待预测个体在时间段T内的视频数据；基于时间段T内的视频数据，计算整段视频数据的身体活跃度，将待预测个体ID、时间段T以及对应的身体活跃度组成待预测数据项；将待预测数据项作为预先构建的身体活跃度异常等级预测模型，预测所述待预测个体的身体活跃度异常等级。本发明以人体关键点识别深度学习模型为基础，对所需要监测的人员进行长时间观测，建立身体活跃度异常等级预测模型，对需要监测人员以后的行为进行监测，根据模型判断哪些行为存在异常，达到提前预警、防止危害发生的目的。

4.

发明公开
一种基于长短映射的跨模态哈希检索方法审中-公开

公开(公告)号：CN118051633A

公开(公告)日：2024-05-17

申请号：CN202410148559.2

申请日：2024-02-01

申请人： 合肥工业大学 , 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)

发明人： 刘学亮 , 涂俊锋 , 闫坤祺 , 郝世杰 , 洪日昌 , 汪萌 , 蒋贻顺

IPC分类号： G06F16/53 , G06F16/583 , G06V10/46 , G06V10/80 , G06V10/82 , G06N3/09

摘要： 本发明涉及跨模态检索技术领域，公开了一种基于长短映射的跨模态哈希检索方法，包括以下步骤：建立多模态数据集，多模态数据集中包括多个由图像以及对应的文本描述组成的图像文本描述对；构建长短映射方法；构建检索模型；哈希检索；本发明通过深度学习提取多维度特征，依据多维度特征之间的相关性差异实现不同维度特征之间的映射以增强低维特征的表现能力并提升检索准确率。

5.

发明公开
一种基于大模型微调的多模态小样本图像分类方法审中-实审

公开(公告)号：CN118038139A

公开(公告)日：2024-05-14

申请号：CN202410129619.6

申请日：2024-01-30

申请人： 合肥工业大学 , 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)

发明人： 刘学亮 , 苏玉玲 , 闫坤祺 , 郭丹 , 洪日昌 , 汪萌 , 蒋贻顺

IPC分类号： G06V10/764 , G06V10/44 , G06V10/74 , G06V10/80 , G06N3/045 , G06N3/096 , G06N3/09

摘要： 本发明涉及计算机视觉技术领域，公开了一种基于大模型微调的多模态小样本图像分类方法，包括：图像文本对的预处理；多模态特征的提取；构建基于CLIP大模型微调的多模态小样本分类模型；类别预测：将测试图像输入到完成训练的分类模型的图像编码器后，得到图像特征，利用余弦分类器，对图像特征与类原型字典中的所有多模态特征的余弦相似度进行计算，相似度最高的多模态特征所述的类别，即为测试图像的预测类别。本发明在视觉‑语言大模型的基础之上，迁移大模型中丰富的多模态信息到特定的图像分类任务上，既通过大模型蕴含的丰富知识来补充数据不足的问题，又充分挖掘图像数据的信息，以实现更加高效的小样本图像分类方法。

6.

发明授权
一种融合GPT2预训练大模型的光学字符识别方法有权转让

公开(公告)号：CN116071759B

公开(公告)日：2023-07-18

申请号：CN202310202217.X

申请日：2023-03-06

申请人： 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)

发明人： 刘学亮 , 汪萌

IPC分类号： G06V30/19 , G06F40/289 , G06V10/82 , G06N3/0442 , G06N3/0455

摘要： 本发明涉及计算机视觉技术领域，公开了一种融合GPT2预训练大模型的光学字符识别方法，将待识别的文本图像输入到光学字符识别模型，得到与文本图像对应的文本；光学字符识别模型的训练方法包括：对文本数据进行预处理后，将文本转化为文本图像，对文本图像进行数据增广，得到文本图像数据集；抽取文本图像的特征矢量：将特征矢量输入到基于预训练的GPT‑2模型的文本解码模块，预测生成相应的文本；将GPT‑2模型的参数冻结，利用CTC损失函数优化文本图像编码模块的参数，再对光学字符识别模型的参数进行微调；本发明能够利用GPT2模型对于文本字符关系的建模能力提高OCR识别的准确率。

7.

发明授权
一种基于自监督学习模型的文档图像内容比对方法有权转让

公开(公告)号：CN115861663B

公开(公告)日：2023-05-23

申请号：CN202310185709.2

申请日：2023-03-01

申请人： 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)

发明人： 刘学亮 , 汪萌

IPC分类号： G06V10/74 , G06V30/418 , G06V10/82 , G06N3/0464 , G06N3/0895

摘要： 本发明涉及计算机视觉技术领域，公开了一种基于自监督学习模型的文档图像内容比对方法，包括以下步骤：将纸质文档转化为扫描版图像，电子文档转化为电子版图像；提取扫描版图像和电子版图像中的字符图像并依次排序，分别形成扫描字符图像序列和电子字符图像序列；将扫描字符图像序列和电子字符图像序列输入至文字比对自监督模型的编码器中，分别得到扫描图像编码序列和电子图像编码序列；计算扫描图像编码序列和电子图像编码序列相同位置i上的两个元素的余弦相似度，当余弦相似度小于设定的阈值时，则认为电子文档位置i处的内容被篡改。本发明不需要检测图像中每个字符的具体内容完成比对，能够提高比对的效率。

8.

发明公开
基于双端对比学习的文本摘要生成方法和系统审中-实审

公开(公告)号：CN115934933A

公开(公告)日：2023-04-07

申请号：CN202310223422.4

申请日：2023-03-09

申请人： 合肥工业大学 , 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)

发明人： 孙晓 , 檀才东 , 汪萌

IPC分类号： G06F16/34 , G06N3/0455 , G06N3/08

摘要： 本发明提供一种基于双端对比学习的文本摘要生成方法和系统，涉及文本摘要生成技术领域。本发明从整体（编码器端和解码器端）提高基于Seq2Seq的文本摘要模型生成高质量摘要的能力；包括：在编码器端，根据所述训练集中的输入文本，获取第一正负样例对，并构建第一损失函数，即利用对比学习增强编码器的编码能力；在解码器端，根据所述训练集中的输入文本和参考摘要，获取第二正负样例对，并构建第二损失函数，即利用对比学习缓解模型的曝光偏差；根据第一、二损失函数，并在所述解码器端引入交叉熵损失函数，构建总损失函数；根据所述总损失函数，对模型进行联合训练直至收敛，并且以单阶段完成，增加模型训练和推理效率。

9.

发明公开
一种驾驶人员失误操作风险预警方法及系统审中-实审转让

公开(公告)号：CN113191214A

公开(公告)日：2021-07-30

申请号：CN202110390322.1

申请日：2021-04-12

申请人： 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)

发明人： 孙晓 , 汪萌

IPC分类号： G06K9/00 , G06N3/04 , G06N3/08 , G06Q10/04 , G06Q10/06 , G06Q50/30 , G08B31/00

摘要： 本发明公开了一种驾驶人员失误操作风险预警方法及系统，属于智能驾驶技术领域，包括：获取待测驾驶人员的实时驾驶视频作为待测数据；对待测数据进行分析，得到预测变量，并将预测变量转换为对应的预测向量；将预测向量作为预先训练好的风险预警模型的输入，得到该待测驾驶人员的风险预警结果。本发明不仅考虑认知负荷对失误操作的影响，还增加了动作协调度、负面情绪变量的作用，将失误操作的风险因素考虑更加齐全，极大地提升了对失误操作的风险预测能力和预测准确率。

10.

发明公开
一种驾驶员路怒风险预警方法及系统有权转让

公开(公告)号：CN113191212A

公开(公告)日：2021-07-30

申请号：CN202110388686.6

申请日：2021-04-12

申请人： 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)

发明人： 孙晓 , 汪萌

IPC分类号： G06K9/00 , G06K9/62 , B60W40/09 , B60W50/14 , G06N3/04 , G06N3/08

摘要： 本发明公开了一种驾驶员路怒风险预警方法及系统，属于智能驾驶辅助技术领域，包括：获取待测驾驶人员的实时驾驶状态数据，该状态数据包括面部活动数据、头部姿态数据、肢体动作数据以及心率数据；将状态数据在情绪变化时间长度最小区间内进行融合，得到融合数据；将融合数据作为预先训练好的路怒等级识别时间序列模型的输入，得到该驾驶人员的路怒风险等级。本发明可在驾驶期间内，持续检测并预警驾驶人员危险驾驶风险情绪，能够在驾驶员发生路怒状态前提前预警，提示驾驶员进行自我情绪调节。

搜索结果

国家/区域

专利有效性

申请日

公布(公告)日

申请人

申请人所在国/区域

发明人

IPC

IPC部

IPC大类

IPC小类

IPC大组

IPC小组

外观分类