-
公开(公告)号:CN117851555A
公开(公告)日:2024-04-09
申请号:CN202311634118.5
申请日:2023-12-01
申请人: 美林数据技术股份有限公司
IPC分类号: G06F16/332 , G06F16/33
摘要: 本申请属于数据分析技术领域,尤其涉及一种基于大语言模型多模态的数据分析方法,整理、收集数据分析自然语言样本数据,对LLM预训练模型进行样本数据训练、参数微调;整理、收集SQL、Cypher、Python脚本指令样本数据,对LLM预训练模型分别进行样本数据训练、参数微调;构建一个执行脚本指令的引擎工具,通过运行得到的脚本指令而获取脚本指令的数据分析结果;构建一个数据分析代理服务,用于接收数据分析自然语言,用于调用意图识别模型进行意图识别,用于调用相应脚本指令生成模型进行指令生成,用于调用脚本指令执行引擎进行脚本指令执行及获取分析数据。本申请降低了数据分析的门槛,提高了数据分析效率,节省了人工成本。
-
公开(公告)号:CN116909535A
公开(公告)日:2023-10-20
申请号:CN202310929905.6
申请日:2023-07-27
申请人: 美林数据技术股份有限公司
IPC分类号: G06F8/33 , G06F16/17 , G06F16/172 , G06F16/16
摘要: 本发明公开一种基于OpenFaas架构的模型计算托管系统,包括有:镜像管理模块,提供镜像上传、在线编辑器、镜像维护功能,镜像管理模块为模型管理模块提供基础运行环境,在线编辑器为模型管理模块的在线编码功能提供支持;模型管理模块,提供模型维护、版本维护、在线编码功能,模型管理模块用于模型的开发,为触发器管理模块提供模型;触发器管理模块,触发器管理模块结合OpenFaas服务,提供触发器维护、监控功能,触发器管理模块用于创建模型对外提供的服务。本发明通过对Openfaas平台的扩展,以无服务器的方式快速构建模型,实现对AI模型的统一管理、部署和运维,有效的解决了企业中存在的模型分散管理难、异构模型部署难、模型统一运维难等一系列痛点问题。
-
公开(公告)号:CN109615555B
公开(公告)日:2023-05-05
申请号:CN201810859842.0
申请日:2018-08-01
申请人: 美林数据技术股份有限公司 , 国网陕西省电力公司 , 国网陕西省电力公司宝鸡供电公司
摘要: 本发明公开基于集成学习算法的用户异常用电行为识别方法及系统,其中识别方法包括步骤一、获取电网的所有电力数据;步骤二、将步骤一获得的电力数据进行筛选,剔除不符合数据协议格式要求的电力数据;步骤三、将步骤二合格的电力数据进行标注,标注方式包括区域,日期,消费额以及用户年龄;步骤四、构建学习模型,将上述标注的电力数据按照标注方式输入至学习模型中;步骤五、所述学习模型根据对应的学习算法定位出疑似异常用电用户。本发明根据电力数据中包含的区域,日期,消费额以及用户年龄等信息,利用学习算法,快速发现用电异常,准确率高,能有效帮助有关部门缩小排查范围,并为电力公司节约人力物力资源。
-
公开(公告)号:CN115827894A
公开(公告)日:2023-03-21
申请号:CN202211588194.2
申请日:2022-12-12
申请人: 美林数据技术股份有限公司
IPC分类号: G06F16/36 , G06F40/295 , G06F16/34
摘要: 本发明公开了一种基于知识图谱的可视化数据解释方法,包括以下步骤:抽取信息,得到结构化信息;利用结构化信息,结合知识图谱雏形构建方法以及知识图谱更新方法,构建通用型知识图谱;将通用型知识图谱与可视化系统连接,进而实时将新接入的数据的关系梳理并更新到所述通用型知识图谱中;用户利用可视化系统,发出解释数据的指令,进而通过通用型知识图谱找出对应的解释内容,并以可视化系统展示和进行更深层次的探索分析。本发明结合了两种方式的知识图谱构建方法,使得整个的数据实现方式更加灵活,进而构建的通用型知识图谱可以高效查询和存储,进行数据解释和分析的方法更加简单。
-
公开(公告)号:CN115809069A
公开(公告)日:2023-03-17
申请号:CN202211470269.7
申请日:2022-11-23
申请人: 美林数据技术股份有限公司
摘要: 本发明公开了一种Spark流水线模型的轻量化预测方法,包括:步骤一、基于Spark Transformer的算法模型开发,实现模型参数的配置、模型的训练、保存及预测功能,同时开发基于MLeap Bundle的模型算子序列化方法,以实现Spark模型的轻量化输出。步骤二,基于实现的各算法模型,构建Spark流水线模型,同时记录各算法模型间的依赖关系,进而调用各模型算子Bundle序列化方法,生成轻量化后的Spark流水线模型。步骤三、基于MLeap Runtime依据Bundle中各算法模型的依赖关系,加载轻量化后的Spark流水线模型,提供高性能的模型预测服务。从而实现Spark模型不依赖Spark框架,在不损失准确度的情况下,提供高性能、实时预测功能,同时降低了存储及计算资源的消耗,解决了Spark模型在实时预测场景下耗时长、吞吐量低的问题。
-
公开(公告)号:CN113947500A
公开(公告)日:2022-01-18
申请号:CN202111201407.7
申请日:2021-10-15
申请人: 美林数据技术股份有限公司
摘要: 本发明公开了一种基于设备拓扑与机器学习的多源网架台账融合方法,包括以下步骤:S101:接入各单系统的网架台账数据,所述网架台账数据包括但不限于实体及实体之间的关系;S102:将接入的各单系统网架台账数据按照所属组织机构进行分类;S103:对每一类实体,筛选出实体在各个系统中的共有属性;S104:根据步骤S103中共有属性值类型的不同,选择不同的相似度计算方法,计算最终的相似度;S105:将最终的相似度与设置的阈值比较,做出判断,两个实体能够融合或不能融合。本发明可以自动地对多系统中的网架台账数据进行自动融合,降低了人工比对的成本,可以有效地提升数据的贯通性,有助于数据管理与价值挖掘。
-
公开(公告)号:CN113920366A
公开(公告)日:2022-01-11
申请号:CN202111201242.3
申请日:2021-10-15
申请人: 美林数据技术股份有限公司
IPC分类号: G06V10/764 , G06N20/00
摘要: 本发明公开了一种基于机器学习的综合加权主数据识别方法,包括以下步骤:步骤1:梳理业务实体域并依据主数据的特点,选出主数据的最具代表性的特征,所述特征至少包括引用的出度及入度;步骤2:根据步骤1中获得的主数据提取出来的识别特征作为随机森林分类的特征,选取训练集,进行数据清洗,基于随机森林算法,选取最优参数构建决策树;步骤3:使用测试集,利用构建的多棵决策树进行测试,得到对应的分类类别;步骤4:采用综合加权法对决策树赋予不同的权重,采用投票法则得到最终分类结果。本发明可提升企业业务主数据查找的准确率及速率,有效提高企业主数据的管理效率。
-
公开(公告)号:CN109270372B
公开(公告)日:2021-04-30
申请号:CN201811071441.5
申请日:2018-09-14
申请人: 美林数据技术股份有限公司
摘要: 本发明公开一种基于线损和用户用电量变化关系的窃电识别系统及方法,系统包括:台区电力数据获取模块,收集所有台区的电力数据;筛选模块,结合所述台区电力数据获取模块的电力数据进行分析,以筛选并定位出线损超出正常值的潜在台区;用户电力数据获取模块,其收集所有用户的电力数据;用电量异动监测模块,根据所有用户的电力数据,并分析出同一用户的不同时间段的用电量变化,并筛选出用电量变化大的潜在用户;处理模块,将所述筛选模块筛选并定位出线损率超出正常值的台区,以及所述用电量异动监测模块筛选出用电量变化大的潜在客户进行整合,用于判别潜在用户是否疑似窃电用户,本发明能快速识别疑似窃电用户,为用电稽查工作提供依据。
-
公开(公告)号:CN107423279B
公开(公告)日:2021-01-15
申请号:CN201710233822.8
申请日:2017-04-11
申请人: 美林数据技术股份有限公司
IPC分类号: G06F40/289 , G06F40/216 , G06F40/242 , G06F40/253 , G06F16/35 , G06F16/36 , G06F16/903 , G06Q40/02
摘要: 本发明公开了一种金融信贷短信的信息抽取和分析方法,包括:训练构建信贷类短信分类模型;使用信贷类短信分类模型对信贷类短信进行识别,并筛选出信贷类短信;构造关键词,并将筛选出的信贷类短信进行关键词匹配后分析具体业务类型;构造信息抽取规则模板引擎;使用信息抽取规则模板引擎对具体业务类型进行信息点的抽取与结构化输出。与现有技术相比,本发明提出了一种适用于金融领域的信贷短息的信息抽取方法,通过机器学习的分类算法和自然语言处理的信息抽取技术,结合规则引擎技术,具备高度的灵活性和可扩展性,实现短信逾期等高风险信息的自动抽取和高效识别。
-
公开(公告)号:CN111859263A
公开(公告)日:2020-10-30
申请号:CN202010536580.1
申请日:2020-06-12
申请人: 美林数据技术股份有限公司
摘要: 本发明公开了一种用于自来水处理的精准投药方法,包括:数据预处理:0值、空值和异常值处理;通过相关性分析,分析进水指标:进水流量、进水浊度、进水PH、投药量与出水浊度之间的关系;构建日均进水浊度与日均投药量线性回归方程;利用系统动态方程算法构建出水浊度预测模型;利用K-L信息法确定投药出水浊度滞后时间;根据曼哈顿距离算法寻找历史样本中的近似样本,进行投药量近似最优解分析;利用模拟退火算法进行投药量寻优最优解分析。本发明实用性强,实现对自来水生产工艺中精准投药的控制,保证出水水质的情况下,有效避免人工饱和式投药带来的经济损失,意义重大。
-
-
-
-
-
-
-
-
-