一种不完整数据的Top-K查询方法和系统

    公开(公告)号:CN113569141A

    公开(公告)日:2021-10-29

    申请号:CN202110811299.9

    申请日:2021-07-19

    Abstract: 本发明公开一种不完整数据的Top‑K查询方法和系统,属于数据查询领域。包括:统计出不完整数据集中每种属性的最小值和最大值,保存数据集中各对象的主键、非主键属性值到元组列表中;遍历元组列表,计算每个对象的最低和最高可能分数,存入元组列表,定位所有对象的最低可能分数位于第K大的值,将其作为判断阈值;遍历元组列表,若对象的最高可能分数不小于判断阈值,将其加入第一候选集;遍历第一候选集,使用填补策略对缺失属性值进行估算,将估算值和最小值中的较大值作为填补值,计算填补后对象的分数,将分数不小于判断阈值的对象加入第二候选集;采用完整数据Top‑K查询方法查询。本发明确保不完整数据Top‑K查询结果正确性的同时有效提高了查询效率。

    基于词汇增强和多特征的中文命名实体识别方法及装置

    公开(公告)号:CN114021549A

    公开(公告)日:2022-02-08

    申请号:CN202111202239.3

    申请日:2021-10-15

    Abstract: 本发明公开了一种基于词汇增强和多特征的中文命名实体识别方法及装置,属于信息抽取技术领域,方法包括:结合双向长短期记忆网络和卷积神经网络提取输入序列的字符特征、通过字符串模式匹配的方式引入字符对应的词汇信息并以词频加权平均的方式提取词汇特征以及使用预训练模型提取预训练特征;使用门控机制来控制词汇特征对字符特征的词汇增强;线性拼接经过词汇增强后的字符特征和预训练特征以构建多特征;基于多特征的上下文相关性以获取上下文特征;标签解码结合上下文特征预测输入序列最佳标签序列。从而使得,提取中文序列的字符特征更充分;提取的词汇特征更丰富且避免了中文分词误差的影响;使用多特征结合的策略模式提高了实体识别指标。

    一种基于PSO-BP神经网络的设备寿命预测方法和系统

    公开(公告)号:CN113743011A

    公开(公告)日:2021-12-03

    申请号:CN202111017563.8

    申请日:2021-08-31

    Abstract: 本发明公开了一种基于PSO‑BP神经网络的设备寿命预测方法和系统,属于设备寿命预测。包括:1)通过获取设备的寿命周期数据,构建数据集,并进行归一化处理;2)构建BP神经网络;3)将BP神经网络的权值和阈值作为粒子的维度分量,并对粒子群算法的参数进行初始化,确定个体最优位置、最优适应度、全局最优位置和适应度;4)采用BP神经网络对数据集进行训练,所得结果由粒子群算法筛选出最优粒子,即网络的最优权值和阈值;5)将粒子群算法的结果作为网络的初始权值和阈值进行训练,直到满足最小误差条件或最大训练次数;6)用训练好的网络对设备数据进行预测,输出设备的预测寿命。与其它技术相比,本方法的优势在于可以迅速精确的完成对设备寿命的预测。

    基于词汇增强和多特征的中文命名实体识别方法及装置

    公开(公告)号:CN114021549B

    公开(公告)日:2024-10-22

    申请号:CN202111202239.3

    申请日:2021-10-15

    Abstract: 本发明公开了一种基于词汇增强和多特征的中文命名实体识别方法及装置,属于信息抽取技术领域,方法包括:结合双向长短期记忆网络和卷积神经网络提取输入序列的字符特征、通过字符串模式匹配的方式引入字符对应的词汇信息并以词频加权平均的方式提取词汇特征以及使用预训练模型提取预训练特征;使用门控机制来控制词汇特征对字符特征的词汇增强;线性拼接经过词汇增强后的字符特征和预训练特征以构建多特征;基于多特征的上下文相关性以获取上下文特征;标签解码结合上下文特征预测输入序列最佳标签序列。从而使得,提取中文序列的字符特征更充分;提取的词汇特征更丰富且避免了中文分词误差的影响;使用多特征结合的策略模式提高了实体识别指标。

Patent Agency Ranking