-
公开(公告)号:CN116628623A
公开(公告)日:2023-08-22
申请号:CN202310590118.3
申请日:2023-05-24
申请人: 西安电子科技大学 , 中国电子科技集团公司第十研究所
IPC分类号: G06F18/25 , G06F18/10 , G06F18/213 , G06Q10/04 , G06Q10/0639 , G06Q50/04 , G06N3/0455 , G06N3/048 , G06N3/047 , G06N3/084 , G06F40/295 , G06F16/901 , G06F16/28 , G06N3/0442 , G06N3/0464 , G06N5/01 , G06N20/20
摘要: 本发明公开一种基于SMT质量大数据的高维特征重构与融合方法,主要解决现有技术中数据利用率低,特征维数过少和预测模型准确率低的问题。其实现方案为:对SMT产线文本数据集及结构化数据集进行预处理;构建并训练文本数据特征提取模型,得到文本数据提取特征;构建结构化数据特征提取模型,得到结构化数据提取特征;合并及去重文本数据和结构化数据提取的特征;采用堆栈式自编码器及基于均方误差与平均绝对百分比误差结合的方法对所提取的特征进行重构与融合。本发明提高了SMT企业数据的利用率,实现了文本数据与结构化数据的融合,数据维度提升到了50维以上,提高了模型的准确率,可用于对SMT产线质量大数据的多模态数据处理。
-
公开(公告)号:CN115098703A
公开(公告)日:2022-09-23
申请号:CN202210870267.0
申请日:2022-07-18
申请人: 西安电子科技大学 , 中国电子科技集团公司第十研究所
摘要: 本发明公开一种基于SMT质量大数据分析的知识图谱构建方法,其步骤为:对SMT产线文本数据集进行预处理,生成SMT产线文本数据训练集和测试集,构建并训练BERT‑Bi‑LSTM‑CRF命名实体模型,其结构包括BERT嵌入层,Bi‑LSTM层和CRF层;构建并训练BERT实体关系抽取模型,其结构包括BERT编码层、信息交互层和关系抽取层;对SMT产线结构化数据进行预处理;利用XGBoost算法计算结构化数据的影响因素;通过SMT产线高发缺陷成因关联分析构建SMT产线质量知识图谱。本发明提高了SMT企业累计数据利用率,形成规则,降低产品坏品率,降低企业生产成本。
-