一种基于大语言模型的无监督文本风格改写方法及系统

    公开(公告)号:CN117807958A

    公开(公告)日:2024-04-02

    申请号:CN202410108670.9

    申请日:2024-01-26

    摘要: 本发明涉及人工智能技术领域,具体为一种基于大语言模型的无监督文本风格改写方法及系统,包括以下步骤:给定风格改写后的文本,利用大语言模型的提示工程,生成对应的改写前的文本,构建平行语料数据;利用构建好的数据对风格改写模型进行微调;有益效果为:本发明提出的基于大语言模型的无监督文本风格改写方法及系统,给定风格改写后的文本,利用大语言模型生成对应的改写前的文本,从而构建平行语料数据,然后提供给风格改写模型进行微调,使模型具备将文本改写成指定风格的能力,用户输入初版文本到模型中,最终返回给用户改写成指定风格后的文本。

    一种基于大语言模型的多媒体片段搜索系统及方法

    公开(公告)号:CN117150070A

    公开(公告)日:2023-12-01

    申请号:CN202310981940.2

    申请日:2023-08-07

    摘要: 本发明涉及人工智能技术领域,具体为一种基于大语言模型的多媒体片段搜索系统及方法,由数据收集模块、模型微调模块、用户交互模块、语音识别模块、语义匹配模块以及用户交互模块构成;有益效果为:本发明提出的基于大语言模型的多媒体片段搜索系统及方法,利用大语言模型强大的语义理解能力,对口语数据进行语义匹配,更加准确、高效,弥补传统方法在口语化数据上无法精确匹配的不足。另外该方法使得用户可以直接听取或查看与其搜索内容相关的音频片段,提供了更直观和全面的搜索结果。本发明实现了准确、高效的音频片段搜索,具备了口语化数据处理和语义匹配的能力为用户提供了更好的搜索体验。

    敏感词检测方法、装置、电子设备及存储介质

    公开(公告)号:CN118709696A

    公开(公告)日:2024-09-27

    申请号:CN202411195870.9

    申请日:2024-08-29

    摘要: 本发明涉及人工智能技术领域,提供一种敏感词检测方法、装置、电子设备及存储介质,包括:获取输入文本;生成针对所述输入文本的敏感词检索任务,将所述敏感词检索任务输入预训练的分类模型,得到所述敏感词检索任务的检索复杂度等级;根据所述检索复杂度等级对应的检索策略,检索敏感词库中的与所述输入文本相关的候选敏感词;将所述候选敏感词和所述输入文本输入生成模型,通过所述生成模型生成标注有所述候选敏感词的输入文本,并对所述标注有所述候选敏感词的输入文本进行敏感词检测。本发明通过检索增强生成技术进行敏感词检测,可以提高敏感词的检测准确性,并且及时屏蔽用户输入文本中的敏感词,保证信息传播的合规性和安全性。

    一种多样性增强的文本检索增强生成方法及系统

    公开(公告)号:CN118260406A

    公开(公告)日:2024-06-28

    申请号:CN202410676300.5

    申请日:2024-05-29

    IPC分类号: G06F16/332 G06F16/33 G06N5/04

    摘要: 本发明提出一种多样性增强的文本检索增强生成方法及系统,属于人工智能技术领域,包括:利用知识数据构建本地知识库;获取用户问题和期望检索结果的数量;在检索阶段,利用大语言模型对用户问题进行改写得到改写后的问题,接着扩充检索范围,在检索结果的数量上进行扩充,在知识库中对用户问题和改写后的问题进行向量检索获得检索结果;计算检索结果之间的相似度,基于相似度计算结果,筛选出多样性的检索结果;通过提示工程将筛选后的检索结果和用户问题进行整合,输入大语言模型中,将模型生成结果作为答案返回给用户,能够提供给用户更丰富、更具信息量的检索结果,提高以其生成内容的丰富性和准确性。

    一种基于大语言模型的问答式检索方法及系统

    公开(公告)号:CN118051590A

    公开(公告)日:2024-05-17

    申请号:CN202410182014.3

    申请日:2024-02-19

    摘要: 本发明公开了一种基于大语言模型的问答式检索方法及系统,属于人工智能技术领域,离线收集大量的来源可靠的数据,经过预处理构建本地知识库,同时记录每条数据的额外信息;用户输入问题后,利用大语言模型识别问题中的过滤条件,以及关键信息,根据过滤条件在知识库中进行筛选,再利用向量化模型将关键信息转化为向量,用语义匹配的方式在知识库中进行检索;然后将检索结果和用户的原始问题利用提示工程进行整合,输入到问答大模型中,最终将模型的回答返回给用户。本发明使得检索方式更为人性化,用户可以通过与检索系统进行自然语言交互,从而获取自己想要的数据,具有简便、高效、应用场景广泛等优点。

    一种基于大语言模型的特定领域智能问答系统及方法

    公开(公告)号:CN117688223A

    公开(公告)日:2024-03-12

    申请号:CN202311698937.6

    申请日:2023-12-12

    摘要: 本发明涉及大语言模型技术领域,具体为一种基于大语言模型的特定领域智能问答系统及方法,由问题分析器、问题分类模块、嵌入模块以及LLM模型组成;问题分析器,根据特定规则生成格式化的问题Qf;问题分类模块,使用在政府相关领域的标记问题上训练的分类模型来识别问题类型T;嵌入模块,获取候选答案;LLM模型,得出最终答案;有益效果为:本发明提出的基于大语言模型的特定领域智能问答系统及方法,通过集成XLNET进行问题分类以及使用SentenceT5进行新颖的相似性搜索方法,我们进而提高了系统的效率和准确性。此外,我们还利用强大的GPT‑3.5‑turbo来生成连贯的答案。我们实现了DSQA‑LLM,并构建了一个包含127,840个问题‑答案对的数据集,有效验证了问答系统的有效性。

    一种动态生成多模态混合专家模型的方法及装置

    公开(公告)号:CN118865409A

    公开(公告)日:2024-10-29

    申请号:CN202411320098.9

    申请日:2024-09-23

    摘要: 本发明涉及多模态模型领域,具体提供了一种动态生成多模态混合专家模型的方法及装置,包括如下:S1.1、对数据进行预处理;S1.2、向量化模块将输入的数据转换为向量;S1.3、经过多层Transformer进行特征提取;S1.4、计算每个模块池中各模块的选择概率;S1.5、动态专家模块根据计算出的概率,将它们按顺序组装成一个专家;S1.6、输出模块通过解码器生成输出;S2.1、预训练阶段;S2.2、模块池初始化阶段;S2.3、全参数训练阶段。与现有技术相比,本发明能够通过动态专家生成、共享层池和动态路由等创新技术,该方法能够有效地处理复杂的多模态数据,同时保持了对单模态任务的良好适应性。