-
公开(公告)号:CN118350412B
公开(公告)日:2024-08-30
申请号:CN202410780437.5
申请日:2024-06-18
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06N3/0442 , G06N3/08
摘要: 本发明公开一种混合专家模型构建方法、装置、设备及存储介质,涉及人工智能和机器学习技术领域;本发明通过动态选择和组合多个领域专家模型,能够提供更加精准、高效的复杂问题解决方案。同时,反馈循环机制使得系统能够不断学习和适应新的数据和问题,增强了模型的长期应用价值。该混合专家模型构建方法、装置、设备及存储介质在金融分析、市场研究、医疗诊断等需要处理和分析大量异构数据的复杂问题情境中具有广阔的应用前景。
-
公开(公告)号:CN117975372B
公开(公告)日:2024-06-28
申请号:CN202410369788.7
申请日:2024-03-29
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06V20/52 , G06V10/764 , G06V10/774 , G06N3/045 , G06N3/0455 , G06V10/80
摘要: 本发明提出一种基于YOLOv8和Transformer编码器相结合的工地安全检测系统及方法,属于工地安全检测技术领域,包括:工地安全图像采集模块,用于在工地采集图像,并收集传回的图像数据;图像数据标注与数据集划分模块,对图像数据进行标注,将图像数据划分训练集、验证集及测试集;神经网络模型,基于改进的SPPFS模块插入YOLO v8l模型的主干网络,将主干网络的输出向量转换为高维向量,高维向量接入编码器,编码器的输出接入多层感知器,多层感知器用于对潜在的安全情况进行检测及分类;精简了YOLOv8主干网络以平衡精度和效果,有效提高了对大目标的特征提取能力,提高了检测效率和对小目标的检测精度。
-
公开(公告)号:CN117555986A
公开(公告)日:2024-02-13
申请号:CN202311453001.7
申请日:2023-11-03
申请人: 山东浪潮科学研究院有限公司
摘要: 本发明提供一种基于大语言模型的智能数据分析方法及装置,属于自然语言处理领域,本发明基于GPT等大语言模型,使用提示学习(PromptLearning)、微调(Fine‑Tuning)和智能代理(Agent),实现领域问题解析、代码生成、代码执行、结果分析的全自动数据分析流程,能够有效针对用户提出的模糊问题进行专业解析,结合历史问答和自动纠错等模块建立可靠的数据分析能力,帮助企业安全、高效的输入自然语言进行数据分析。
-
公开(公告)号:CN117493952A
公开(公告)日:2024-02-02
申请号:CN202311403825.3
申请日:2023-10-27
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06F18/241 , G06F18/213 , G06F18/214 , G06F18/21 , G06N3/0499 , G06N3/08
摘要: 本发明提供一种利用大规模语言模型对振动波分析的方法,属于振动分析技术领域,首先检测振动波信息,将其转换为数字信息,然后通过训练好的全连接层,将数字信息转换为大规模语言模型可处理的嵌入向量表示。通过输入到大规模语言模型中进行处理和分析,可以识别振动波的类型、判断机械设备的运行状态等,从而实现对振动波进行快速、准确的分析,并且输出通俗易懂的语言,操作便捷。该方法适用于机械制造、设备监测、故障诊断等领域。
-
公开(公告)号:CN118673101A
公开(公告)日:2024-09-20
申请号:CN202411162580.4
申请日:2024-08-23
申请人: 山东浪潮科学研究院有限公司
摘要: 本发明提供的数据检索方法、装置、电子设备及存储介质,涉及电数字数据处理技术领域,通过特征信息获取查询语句的匹配字段,实现了根据查询意图、关键信息和上下文信息进行精准匹配,提高了匹配字段组的准确性。根据字段‑主题映射表获取匹配字段组,实现了对查询语句的快速定位,有利于提高数据检索的效率和准确性。根据扩展匹配字段组进行多维度检索,实现了根据匹配字段组的实体进行检索,有利于提高数据检索的精度和效率。根据扩展匹配字段组的权重对检索结果进行加权融合,能够准确的获取每个检索结果的权重情况,便于用户快速的找到与查询语句最相关的检索数据。
-
公开(公告)号:CN118350412A
公开(公告)日:2024-07-16
申请号:CN202410780437.5
申请日:2024-06-18
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06N3/0442 , G06N3/08
摘要: 本发明公开一种混合专家模型构建方法、装置、设备及存储介质,涉及人工智能和机器学习技术领域;本发明通过动态选择和组合多个领域专家模型,能够提供更加精准、高效的复杂问题解决方案。同时,反馈循环机制使得系统能够不断学习和适应新的数据和问题,增强了模型的长期应用价值。该混合专家模型构建方法、装置、设备及存储介质在金融分析、市场研究、医疗诊断等需要处理和分析大量异构数据的复杂问题情境中具有广阔的应用前景。
-
公开(公告)号:CN117688220A
公开(公告)日:2024-03-12
申请号:CN202311698936.1
申请日:2023-12-12
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06F16/903 , G06F16/907 , G06F16/901 , G06F40/30
摘要: 本发明涉及自然语言处理技术领域,具体为一种基于大语言模型的多模态信息检索方法及系统,包括以下步骤:引入大语言模型的能力分析用户的检索意图输出统一的检索关键信息;通过多模态embedding模型处理多模态信息生成统一的高维向量存入向量数据库;通过结构化检索和向量检索相结合的方式实现实现文本‑多模态数据的高效精确检索;有益效果为:本发明提出的基于大语言模型的多模态信息检索方法及系统,使用大模型充分挖掘分析用户的检索意图,使用embedding模型充分利用跨模态的语义关联信息,针对向量检索模糊匹配的特性进行优化,创新提出结构化搜索与向量检索相结合的方法,极大提高了检索的精度。
-
公开(公告)号:CN117520501A
公开(公告)日:2024-02-06
申请号:CN202311473639.7
申请日:2023-11-08
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06F16/332 , G06F16/335 , G06F16/583 , G06Q30/01 , G06N3/0464 , G06N3/08
摘要: 本发明涉及自然语言处理技术领域,具体为一种基于大型语言模型的多模态智能客服方法,包括以下步骤:接收用户输入的文本和图片信息;将用户输入的文本信息和图片信息分别进行处理,映射为一维向量信息;将用户输入的文本信息和图片信息的向量进行融合,生成词向量;将生成的词向量与用户输入的文本内容进行拼接,得到拼接向量;将拼接后的词向量输入预训练好的语言模型,生成相应的答案;将生成的答案返回给用户;有益效果为:本发明提出的基于大型语言模型的多模态智能客服方法,将用户输入的文字和图片信息映射为一维向量信息,并进行向量融合与向量拼接,生成词向量,然后输入预训练好的大规模语言模型,从而实现智能回答相应问题的功能。
-
公开(公告)号:CN118865409A
公开(公告)日:2024-10-29
申请号:CN202411320098.9
申请日:2024-09-23
申请人: 山东浪潮科学研究院有限公司
摘要: 本发明涉及多模态模型领域,具体提供了一种动态生成多模态混合专家模型的方法及装置,包括如下:S1.1、对数据进行预处理;S1.2、向量化模块将输入的数据转换为向量;S1.3、经过多层Transformer进行特征提取;S1.4、计算每个模块池中各模块的选择概率;S1.5、动态专家模块根据计算出的概率,将它们按顺序组装成一个专家;S1.6、输出模块通过解码器生成输出;S2.1、预训练阶段;S2.2、模块池初始化阶段;S2.3、全参数训练阶段。与现有技术相比,本发明能够通过动态专家生成、共享层池和动态路由等创新技术,该方法能够有效地处理复杂的多模态数据,同时保持了对单模态任务的良好适应性。
-
公开(公告)号:CN118673969A
公开(公告)日:2024-09-20
申请号:CN202411146611.7
申请日:2024-08-21
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06N3/0499 , G06N3/082
摘要: 本发明提出一种基于KAN网络的大模型压缩方法及系统,属于人工智能技术领域,将语言模型中的多层感知机结构替换为三层的KAN网络,其中第一层由输入到隐藏单元的边组成,第二层由隐藏单元之间的边组成,第三层由隐藏单元到输出的边组成,每条边都与一个可学习的一元函数相关联,这些函数使用B样条参数化,在模型训练时,通过在损失函数中引入L1正则化项来诱导KAN网络的稀疏性,使得许多边的权重趋于零,训练后,去除权重小于阈值的边,并将B样条激活函数近似为分段函数,得到一个紧凑、高效的压缩模型,能在保持模型性能的同时,显著减少参数量和推理计算量,可广泛应用于各类大型语言模型的压缩。
-
-
-
-
-
-
-
-
-