-
公开(公告)号:CN109784818A
公开(公告)日:2019-05-21
申请号:CN201910089851.0
申请日:2019-01-30
Applicant: 美林数据技术股份有限公司
Abstract: 本公开提供一种基于BOM的产品数据处理方法、装置、设备及存储介质,涉及数据处理领域,能够解决产品各阶段数据分散,查找耗时耗力的问题。具体技术方案为:获取目标产品的设计物料清单;根据目标产品的设计物料清单,配置目标产品中每个物料与预先设置的数据表集合中每个数据表的关联关系;获取目标产品的实物物料清单;根据目标产品的实物物料清单和关联关系,从数据表集合中获取目标产品在产品全生命周期的产品数据。本发明用于根据实物BOM结构对产品全生命周期数据进行归集和展示。
-
-
公开(公告)号:CN107423279A
公开(公告)日:2017-12-01
申请号:CN201710233822.8
申请日:2017-04-11
Applicant: 美林数据技术股份有限公司
Abstract: 本发明公开了一种金融信贷短信的信息抽取和分析方法,包括:训练构建信贷类短信分类模型;使用信贷类短信分类模型对信贷类短信进行识别,并筛选出信贷类短信;构造关键词,并将筛选出的信贷类短信进行关键词匹配后分析具体业务类型;构造信息抽取规则模板引擎;使用信息抽取规则模板引擎对具体业务类型进行信息点的抽取与结构化输出。与现有技术相比,本发明提出了一种适用于金融领域的信贷短息的信息抽取方法,通过机器学习的分类算法和自然语言处理的信息抽取技术,结合规则引擎技术,具备高度的灵活性和可扩展性,实现短信逾期等高风险信息的自动抽取和高效识别。
-
公开(公告)号:CN107193876A
公开(公告)日:2017-09-22
申请号:CN201710267672.2
申请日:2017-04-21
Applicant: 美林数据技术股份有限公司
IPC: G06F17/30
Abstract: 本发明公开了一种基于最近邻KNN算法的缺失数据填补方法,包括:自动识别数据集中的存在缺失值的特征属性;遍历存在缺失值的特征属性利用近邻KNN算法逐步填充缺失值;在对每一个特征属性进行缺失值填充过程中,迭代KNN算法参数k,获得不同参数配置的KNN模型簇;根据优化目标函数遴选最优模型,并利用该模型对缺失数据进行缺失值填充。由于算法参数k对KNN算法影响较大,在此,我们采用寻优的策略运用到缺失值填充模型的建模中,可以很大程度提高模型的精度,填充数据的质量相应有了很大程度的提高。
-
公开(公告)号:CN107103441A
公开(公告)日:2017-08-29
申请号:CN201710267283.X
申请日:2017-04-21
Applicant: 美林数据技术股份有限公司
CPC classification number: G06Q10/087 , G06K9/6218 , G06K9/6247 , G06K9/6267 , G06Q10/0875
Abstract: 本发明公开了基于自组织特征映射网络的电力物资分类方法,包括以下步骤:物资数据采集:选取物资数据并将选取的物资数据构建成电力物资指标体系;物资数据分析:将电力物资指标体系中的数据按照非线性主成分分析法选择出电力物资主成分分析指标;物资分类:采用自组织特征映射网络(SOFM)算法对选择出的电力物资主成分分析指标进行指标细分,并根据细分指标做聚类,建立电力物资的分类。
-
公开(公告)号:CN106446034A
公开(公告)日:2017-02-22
申请号:CN201610781312.X
申请日:2016-08-30
Applicant: 西安美林数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F16/90328
Abstract: 本发明公开了数据可视化查询语言系统,包括:DVL构建器,所述将用户操作模型和数据模型构建为DVL语句,所述DVL构建器连接有数据模块模块,操作模型模块以及DVL语法规则模块;DVL解析引擎模块连接有DVL构建器以将DVL语句解析为执行子过程的执行计划树;还包括数据分析引擎模块将执行子过程的执行计划树按照执行顺序逐一执行,融合图形信息和数据信息,生成图形数据模型;所述获取的图形数据模块送至可视化引擎模块,可视化引擎模块将图形模型数据渲染为用户可见的BI图表。此发明是将系统前端可视化图表展现和后端数据分析过程进行了语言(DVL)级别的隔离,从而实现了图形展现和后端数据处理的完全解耦,并可提对外提供语言级别的标准数据可视化接口。
-
公开(公告)号:CN106203683A
公开(公告)日:2016-12-07
申请号:CN201610497287.2
申请日:2016-06-29
Applicant: 西安美林数据技术股份有限公司
Abstract: 本发明公开了一种电力客户用电负荷预测的建模方法,包括:对过去若干年的历史日的用电负荷进行分群,分为工作日集合和非工作日集合;根据分群结果分别对工作日集合和非工作日集合的用电负荷进行建模;对预测日按是否工作日与分群结果进行匹配,以匹配对应集合的模型对预测日负荷进行预测,得到初步预测结果;还包括利用马尔可夫求取预测误差转移矩阵,得到预测日误差修正值;由初步预测结果和预测日误差修正值得到最终预测结果。本发明实现对用电负荷的预测,为电网的投资规划提供依据,提高电网工作效率。
-
公开(公告)号:CN105427194A
公开(公告)日:2016-03-23
申请号:CN201510967788.8
申请日:2015-12-21
Applicant: 西安美林数据技术股份有限公司
IPC: G06Q50/06
CPC classification number: G06Q50/06
Abstract: 本发明公开了一种基于随机森林回归的售电量预测方法及装置,依据预设时长内的历史的月售电量数据,以及预先确定的若干影响因素指标,建立基于随机森林回归的月售电量预测模型。获取和计算待预测月的上述若干影响因素指标,代入月售电量预测模型,得到未来待预测月的月售电量预测结果。
-
公开(公告)号:CN105302915A
公开(公告)日:2016-02-03
申请号:CN201510782709.6
申请日:2015-12-23
Applicant: 西安美林数据技术股份有限公司
IPC: G06F17/30
CPC classification number: G06F17/30557 , G06F17/30321 , G06F17/30448 , G06F17/30563
Abstract: 本发明公开了基于内存计算的高性能数据处理系统,包括:一数据采集接口定义模块,通过选择数据表,并自动提取数据表相关字段,由用户根据字段类型和范围进行压缩方式定义;一数据实时采集模块,根据数据采集接口定义模块定义的元数据从数据源抽取相关数据,其中元数据一般指定义数据格式的数据,数据源是指具体业务数据,一般指企业业务系统关系数据库;一数据内存存储模块,将数据通过字典方式,整形编码和压缩算法以字节码的形式存内存之中;以及一数据处理模块,所述数据处理模块包括SQL解析模块,根据需要将统计中的记录进行提取。本发明将数据经过在不损失统计精度和速度的前提下经过压缩和重组以字节的方式存入内存。
-
公开(公告)号:CN117873461A
公开(公告)日:2024-04-12
申请号:CN202311633679.3
申请日:2023-12-01
Applicant: 美林数据技术股份有限公司
Abstract: 本申请属于机器学习技术领域,尤其涉及一种多语言Pipeline轻量模型构建方法,步骤一、Python通用算法模型的开发:设计python和scala,java语言之间离线批量数据传输结构;基于Spark、Mleap框架开发python算子,实现spark Dataframe在scala和python语言之间数据传输;步骤二、ML Pipeline模型训练流程搭建:基于业务场景,选择算子搭建机器学习流水线模型,调用模型的序列化方法,生成最终的MLeap Bundle模型。步骤三、基于MLeap Runtime的实时预测服务搭建:搭建mleap runtime运行池环境,将Spark MLlib模型序列化成MLeap格式,部署一个预测服务,加载序列化的模型并处理实际的预测请求。该方法使用Python和Scala,Java三种不同的语言以及相关的机器学习库和框架混合建模,提出了端到端的多语言机器学习pipeline,从而充分发挥它们各自的优势。
-
-
-
-
-
-
-
-
-