-
公开(公告)号:CN118779623A
公开(公告)日:2024-10-15
申请号:CN202410752333.3
申请日:2024-06-12
Applicant: 广州市城市规划勘测设计研究院有限公司
IPC: G06F18/21 , G06F18/27 , G06F18/214 , G06F18/22 , G06Q10/1053
Abstract: 本申请公开了一种大数据企业识别方法、系统、电子设备及存储介质,方法包括:获取企业的企业数据,并进行预处理;将预处理后的企业数据输入Doc2vec模型进行训练,利用训练好的Doc2vec模型计算待预测企业各目标单词文本与已知大数据企业各目标单词文本之间的相关性,并计算待预测企业的所有目标单词文本与已知大数据企业的目标单词文本之间的相关性的均值;将待预测企业的所有目标单词文本与已知大数据企业的目标单词文本之间的相关性的均值输入至训练好逻辑回归模型,预测大数据企业类型的概率,得识别结果。本申请通过综合利用企业多维度数据,结合Doc2vec模型和逻辑回归模型的优势,能够精准地识别大数据企业,并提高了识别效率。