一种基于大语言模型多模态的数据分析方法

    公开(公告)号:CN117851555A

    公开(公告)日:2024-04-09

    申请号:CN202311634118.5

    申请日:2023-12-01

    IPC分类号: G06F16/332 G06F16/33

    摘要: 本申请属于数据分析技术领域,尤其涉及一种基于大语言模型多模态的数据分析方法,整理、收集数据分析自然语言样本数据,对LLM预训练模型进行样本数据训练、参数微调;整理、收集SQL、Cypher、Python脚本指令样本数据,对LLM预训练模型分别进行样本数据训练、参数微调;构建一个执行脚本指令的引擎工具,通过运行得到的脚本指令而获取脚本指令的数据分析结果;构建一个数据分析代理服务,用于接收数据分析自然语言,用于调用意图识别模型进行意图识别,用于调用相应脚本指令生成模型进行指令生成,用于调用脚本指令执行引擎进行脚本指令执行及获取分析数据。本申请降低了数据分析的门槛,提高了数据分析效率,节省了人工成本。

    一种基于OpenFaas架构的模型计算托管系统

    公开(公告)号:CN116909535A

    公开(公告)日:2023-10-20

    申请号:CN202310929905.6

    申请日:2023-07-27

    摘要: 本发明公开一种基于OpenFaas架构的模型计算托管系统,包括有:镜像管理模块,提供镜像上传、在线编辑器、镜像维护功能,镜像管理模块为模型管理模块提供基础运行环境,在线编辑器为模型管理模块的在线编码功能提供支持;模型管理模块,提供模型维护、版本维护、在线编码功能,模型管理模块用于模型的开发,为触发器管理模块提供模型;触发器管理模块,触发器管理模块结合OpenFaas服务,提供触发器维护、监控功能,触发器管理模块用于创建模型对外提供的服务。本发明通过对Openfaas平台的扩展,以无服务器的方式快速构建模型,实现对AI模型的统一管理、部署和运维,有效的解决了企业中存在的模型分散管理难、异构模型部署难、模型统一运维难等一系列痛点问题。

    一种基于知识图谱的可视化数据解释

    公开(公告)号:CN115827894A

    公开(公告)日:2023-03-21

    申请号:CN202211588194.2

    申请日:2022-12-12

    摘要: 本发明公开了一种基于知识图谱的可视化数据解释方法,包括以下步骤:抽取信息,得到结构化信息;利用结构化信息,结合知识图谱雏形构建方法以及知识图谱更新方法,构建通用型知识图谱;将通用型知识图谱与可视化系统连接,进而实时将新接入的数据的关系梳理并更新到所述通用型知识图谱中;用户利用可视化系统,发出解释数据的指令,进而通过通用型知识图谱找出对应的解释内容,并以可视化系统展示和进行更深层次的探索分析。本发明结合了两种方式的知识图谱构建方法,使得整个的数据实现方式更加灵活,进而构建的通用型知识图谱可以高效查询和存储,进行数据解释和分析的方法更加简单。

    一种基于设备拓扑与机器学习的多源网架台账融合方法

    公开(公告)号:CN113947500A

    公开(公告)日:2022-01-18

    申请号:CN202111201407.7

    申请日:2021-10-15

    摘要: 本发明公开了一种基于设备拓扑与机器学习的多源网架台账融合方法,包括以下步骤:S101:接入各单系统的网架台账数据,所述网架台账数据包括但不限于实体及实体之间的关系;S102:将接入的各单系统网架台账数据按照所属组织机构进行分类;S103:对每一类实体,筛选出实体在各个系统中的共有属性;S104:根据步骤S103中共有属性值类型的不同,选择不同的相似度计算方法,计算最终的相似度;S105:将最终的相似度与设置的阈值比较,做出判断,两个实体能够融合或不能融合。本发明可以自动地对多系统中的网架台账数据进行自动融合,降低了人工比对的成本,可以有效地提升数据的贯通性,有助于数据管理与价值挖掘。

    一种基于机器学习的综合加权主数据识别方法

    公开(公告)号:CN113920366A

    公开(公告)日:2022-01-11

    申请号:CN202111201242.3

    申请日:2021-10-15

    IPC分类号: G06V10/764 G06N20/00

    摘要: 本发明公开了一种基于机器学习的综合加权主数据识别方法,包括以下步骤:步骤1:梳理业务实体域并依据主数据的特点,选出主数据的最具代表性的特征,所述特征至少包括引用的出度及入度;步骤2:根据步骤1中获得的主数据提取出来的识别特征作为随机森林分类的特征,选取训练集,进行数据清洗,基于随机森林算法,选取最优参数构建决策树;步骤3:使用测试集,利用构建的多棵决策树进行测试,得到对应的分类类别;步骤4:采用综合加权法对决策树赋予不同的权重,采用投票法则得到最终分类结果。本发明可提升企业业务主数据查找的准确率及速率,有效提高企业主数据的管理效率。

    一种基于线损和用户用电量变化关系的窃电识别系统及方法

    公开(公告)号:CN109270372B

    公开(公告)日:2021-04-30

    申请号:CN201811071441.5

    申请日:2018-09-14

    IPC分类号: G01R31/00 G06F17/18

    摘要: 本发明公开一种基于线损和用户用电量变化关系的窃电识别系统及方法,系统包括:台区电力数据获取模块,收集所有台区的电力数据;筛选模块,结合所述台区电力数据获取模块的电力数据进行分析,以筛选并定位出线损超出正常值的潜在台区;用户电力数据获取模块,其收集所有用户的电力数据;用电量异动监测模块,根据所有用户的电力数据,并分析出同一用户的不同时间段的用电量变化,并筛选出用电量变化大的潜在用户;处理模块,将所述筛选模块筛选并定位出线损率超出正常值的台区,以及所述用电量异动监测模块筛选出用电量变化大的潜在客户进行整合,用于判别潜在用户是否疑似窃电用户,本发明能快速识别疑似窃电用户,为用电稽查工作提供依据。

    一种用于自来水处理的精准投药方法

    公开(公告)号:CN111859263A

    公开(公告)日:2020-10-30

    申请号:CN202010536580.1

    申请日:2020-06-12

    摘要: 本发明公开了一种用于自来水处理的精准投药方法,包括:数据预处理:0值、空值和异常值处理;通过相关性分析,分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系;构建日均进水浊度与日均投药量线性回归方程;利用系统动态方程算法构建出水浊度预测模型;利用K-L信息法确定投药出水浊度滞后时间;根据曼哈顿距离算法寻找历史样本中的近似样本,进行投药量近似最优解分析;利用模拟退火算法进行投药量寻优最优解分析。本发明实用性强,实现对自来水生产工艺中精准投药的控制,保证出水水质的情况下,有效避免人工饱和式投药带来的经济损失,意义重大。