-
公开(公告)号:CN117807958A
公开(公告)日:2024-04-02
申请号:CN202410108670.9
申请日:2024-01-26
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06F40/151 , G06F40/253 , G06N3/088
摘要: 本发明涉及人工智能技术领域,具体为一种基于大语言模型的无监督文本风格改写方法及系统,包括以下步骤:给定风格改写后的文本,利用大语言模型的提示工程,生成对应的改写前的文本,构建平行语料数据;利用构建好的数据对风格改写模型进行微调;有益效果为:本发明提出的基于大语言模型的无监督文本风格改写方法及系统,给定风格改写后的文本,利用大语言模型生成对应的改写前的文本,从而构建平行语料数据,然后提供给风格改写模型进行微调,使模型具备将文本改写成指定风格的能力,用户输入初版文本到模型中,最终返回给用户改写成指定风格后的文本。
-
公开(公告)号:CN117556003A
公开(公告)日:2024-02-13
申请号:CN202311453003.6
申请日:2023-11-03
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06F16/332 , G06F16/33
摘要: 本发明提供一种基于大语言模型的检索式智能问答方法及系统,属于人工智能领域,本发明通过少量的口语化问题和标准问题的数据,利用大语言模型即可生成大量的具有口语特征的问题和标准问题的映射关系,从而提供给向量化模型和语义匹配大语言模型进行微调,使系统能够很好的应对口语场景。该发明使得检索式问答系统能够很好地应对口语化场景,并且无需人工收集大量数据,具有简单高效、维护简单、应用场景广泛等优点。
-
公开(公告)号:CN117150070A
公开(公告)日:2023-12-01
申请号:CN202310981940.2
申请日:2023-08-07
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06F16/635 , G06F16/638 , G06F16/683
摘要: 本发明涉及人工智能技术领域,具体为一种基于大语言模型的多媒体片段搜索系统及方法,由数据收集模块、模型微调模块、用户交互模块、语音识别模块、语义匹配模块以及用户交互模块构成;有益效果为:本发明提出的基于大语言模型的多媒体片段搜索系统及方法,利用大语言模型强大的语义理解能力,对口语数据进行语义匹配,更加准确、高效,弥补传统方法在口语化数据上无法精确匹配的不足。另外该方法使得用户可以直接听取或查看与其搜索内容相关的音频片段,提供了更直观和全面的搜索结果。本发明实现了准确、高效的音频片段搜索,具备了口语化数据处理和语义匹配的能力为用户提供了更好的搜索体验。
-
公开(公告)号:CN118709696A
公开(公告)日:2024-09-27
申请号:CN202411195870.9
申请日:2024-08-29
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06F40/295 , G06F40/216 , G06F16/953 , G06F3/023
摘要: 本发明涉及人工智能技术领域,提供一种敏感词检测方法、装置、电子设备及存储介质,包括:获取输入文本;生成针对所述输入文本的敏感词检索任务,将所述敏感词检索任务输入预训练的分类模型,得到所述敏感词检索任务的检索复杂度等级;根据所述检索复杂度等级对应的检索策略,检索敏感词库中的与所述输入文本相关的候选敏感词;将所述候选敏感词和所述输入文本输入生成模型,通过所述生成模型生成标注有所述候选敏感词的输入文本,并对所述标注有所述候选敏感词的输入文本进行敏感词检测。本发明通过检索增强生成技术进行敏感词检测,可以提高敏感词的检测准确性,并且及时屏蔽用户输入文本中的敏感词,保证信息传播的合规性和安全性。
-
公开(公告)号:CN118503394A
公开(公告)日:2024-08-16
申请号:CN202410953959.0
申请日:2024-07-17
申请人: 山东浪潮科学研究院有限公司
摘要: 本发明涉及自然语言处理技术,特别是涉及一种基于大语言模型的自适应决策方法、系统及存储介质,本发明通过对输入问题的复杂性进行分析和评估,组建不同领域的专家模型团队,使得能够灵活调用和组合各领域的深入知识,弥补了单一模型的知识局限性,达到优化决策效率和准确性的目的,通过讨论机制和策略集成来优化决策制定,提升专家模型在处理复杂任务时的整体性能,从而大大提升了处理复杂问题时的推理能力。
-
公开(公告)号:CN118260406A
公开(公告)日:2024-06-28
申请号:CN202410676300.5
申请日:2024-05-29
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06N5/04
摘要: 本发明提出一种多样性增强的文本检索增强生成方法及系统,属于人工智能技术领域,包括:利用知识数据构建本地知识库;获取用户问题和期望检索结果的数量;在检索阶段,利用大语言模型对用户问题进行改写得到改写后的问题,接着扩充检索范围,在检索结果的数量上进行扩充,在知识库中对用户问题和改写后的问题进行向量检索获得检索结果;计算检索结果之间的相似度,基于相似度计算结果,筛选出多样性的检索结果;通过提示工程将筛选后的检索结果和用户问题进行整合,输入大语言模型中,将模型生成结果作为答案返回给用户,能够提供给用户更丰富、更具信息量的检索结果,提高以其生成内容的丰富性和准确性。
-
公开(公告)号:CN118051590A
公开(公告)日:2024-05-17
申请号:CN202410182014.3
申请日:2024-02-19
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06F16/332 , G06F16/33 , G06F16/335 , G06F16/36 , G06N5/022 , G06N5/04
摘要: 本发明公开了一种基于大语言模型的问答式检索方法及系统,属于人工智能技术领域,离线收集大量的来源可靠的数据,经过预处理构建本地知识库,同时记录每条数据的额外信息;用户输入问题后,利用大语言模型识别问题中的过滤条件,以及关键信息,根据过滤条件在知识库中进行筛选,再利用向量化模型将关键信息转化为向量,用语义匹配的方式在知识库中进行检索;然后将检索结果和用户的原始问题利用提示工程进行整合,输入到问答大模型中,最终将模型的回答返回给用户。本发明使得检索方式更为人性化,用户可以通过与检索系统进行自然语言交互,从而获取自己想要的数据,具有简便、高效、应用场景广泛等优点。
-
公开(公告)号:CN117688223A
公开(公告)日:2024-03-12
申请号:CN202311698937.6
申请日:2023-12-12
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06F16/9032 , G06F16/903 , G06F16/906
摘要: 本发明涉及大语言模型技术领域,具体为一种基于大语言模型的特定领域智能问答系统及方法,由问题分析器、问题分类模块、嵌入模块以及LLM模型组成;问题分析器,根据特定规则生成格式化的问题Qf;问题分类模块,使用在政府相关领域的标记问题上训练的分类模型来识别问题类型T;嵌入模块,获取候选答案;LLM模型,得出最终答案;有益效果为:本发明提出的基于大语言模型的特定领域智能问答系统及方法,通过集成XLNET进行问题分类以及使用SentenceT5进行新颖的相似性搜索方法,我们进而提高了系统的效率和准确性。此外,我们还利用强大的GPT‑3.5‑turbo来生成连贯的答案。我们实现了DSQA‑LLM,并构建了一个包含127,840个问题‑答案对的数据集,有效验证了问答系统的有效性。
-
公开(公告)号:CN118865409A
公开(公告)日:2024-10-29
申请号:CN202411320098.9
申请日:2024-09-23
申请人: 山东浪潮科学研究院有限公司
摘要: 本发明涉及多模态模型领域,具体提供了一种动态生成多模态混合专家模型的方法及装置,包括如下:S1.1、对数据进行预处理;S1.2、向量化模块将输入的数据转换为向量;S1.3、经过多层Transformer进行特征提取;S1.4、计算每个模块池中各模块的选择概率;S1.5、动态专家模块根据计算出的概率,将它们按顺序组装成一个专家;S1.6、输出模块通过解码器生成输出;S2.1、预训练阶段;S2.2、模块池初始化阶段;S2.3、全参数训练阶段。与现有技术相比,本发明能够通过动态专家生成、共享层池和动态路由等创新技术,该方法能够有效地处理复杂的多模态数据,同时保持了对单模态任务的良好适应性。
-
公开(公告)号:CN117992078B
公开(公告)日:2024-07-12
申请号:CN202410397188.1
申请日:2024-04-03
申请人: 山东浪潮科学研究院有限公司
IPC分类号: G06F8/61 , G06F8/65 , G06F8/71 , G06F9/50 , G06F9/54 , G06F9/455 , H04L67/02 , H04L67/1008 , H04L67/133 , G06N5/04 , G06N3/0455 , G06N3/0464 , G06N3/0442 , G06N3/0495 , G06N3/082
摘要: 本发明涉及人工智能技术领域,具体涉及一种基于TensorRT‑LLM模型推理加速服务的自动化部署方法,包括以下步骤:S1:通过用户界面接收用户选择的模型;S2:评估并选择合适的加速配置;S3:生成加速模型引擎;S4:在隔离的预测试环境中部署加速模型引擎,并自动分配所需的GPU资源;S5:调整加速配置和GPU资源分配;S6:将优化后的模型进行线上推理服务的自动化部署;S7:监控和管理线上部署的模型推理服务。本发明,通过自动化加速策略选择和利用现代容器化及推理框架实现快速部署,结合统一的管理界面提供高效的模型监控和运维,显著提升了深度学习模型的推理性能、部署效率及服务的稳定性和可管理性。
-
-
-
-
-
-
-
-
-