基于属性相似度的数据填补方法、装置、设备及存储介质

    公开(公告)号:CN109033454A

    公开(公告)日:2018-12-18

    申请号:CN201810981153.7

    申请日:2018-08-27

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种基于属性相似度的数据填补方法,在确定出待填补信息系统的各属性信息中含有缺失数据的属性信息之后,就在待填补信息系统中的多个目标对象中查找与各含有缺失数据的属性信息对应的数据,然后依据各目标对象的属性相似度为各目标对象赋权值,对查找到的多个数据进行加权求和,用加权求和后的数据值填补各含有缺失数据的属性信息对应的缺失数据,与现有技术中只选取一个最相似的对象中相同属性信息下的相关数据,直接用选取的该数据去填补缺失数据相比,应用本填补方法,产生的数据误差小,填补的数据准确性高。另外,本发明还公开了一种基于属性相似度的数据填补装置、设备及存储介质,效果如上。

    一种文本分类方法及装置

    公开(公告)号:CN109657064A

    公开(公告)日:2019-04-19

    申请号:CN201910151793.X

    申请日:2019-02-28

    IPC分类号: G06F16/35 G06F17/27

    摘要: 本发明公开了一种文本分类方法,包括:获取训练样本;对所述训练样本进行分词,得到分词列表;根据所述分词列表确定词频文档矩阵,并计算分词列表中各词语的TF-IDF值矩阵;将所述词语作为变量输入模型,根据CV图获取最佳λ值和最优变量个数范围;将所述最优λ值作为参数拟合lasso回归模型,并输出特征变量;以特征词的词频文档矩阵创建训练容器;构建所述训练样本的SLDA有监督模型;通过Lasso回归模型得到的特征变量集合,并根据所述特征变量集合更新所述词频文档矩阵;在所述词频文档矩阵上应用训练好的SLDA模型,输出预测结果和预测概率。本发明成本低且效率高,可推广性强,可以剔除人的主观因素对结果的影响。

    一种能源互联网直流电网及设备建模方法

    公开(公告)号:CN110445165A

    公开(公告)日:2019-11-12

    申请号:CN201910684145.0

    申请日:2019-07-26

    IPC分类号: H02J3/36

    摘要: 本发明公开了一种能源互联网直流电网及设备建模方法,包括以下步骤:选择一个经典的直流设备扩展模型,并在导线端添加直流架空线和电缆、设置单位长度直流线路参数、在导电设备和开关之间的直流母线上连接换流器、交直流变换器、直流斩波器和接地线、添加直流侧电流源换流器和直流侧电压源换流器、在导电设备和开关之间的添加在分流装置和串联装置、在开关端添加隔离开关以及断路器上添加直流断路器;本发明通过在经典的直流设备扩展模型上进行扩展添加,扩展后的直流设备扩展模型内的直流断路器可以保证能源互联网直流电网及设备模型系统能够安全高效的进行运行,提高了能源互联网直流电网及设备模型系统的供电能力和运行效率。