-
公开(公告)号:CN112800183B
公开(公告)日:2023-09-26
申请号:CN202110212680.3
申请日:2021-02-25
申请人: 国网河北省电力有限公司电力科学研究院 , 国家电网有限公司
IPC分类号: G06F16/33 , G06F40/242 , G06F40/30
摘要: 本发明适用于数据处理技术领域,提供了一种内容名称数据处理方法及终端设备,上述方法包括:获取待处理内容名称数据,根据预设的查询词典将待处理内容名称数据转换为初始矩阵向量;对初始矩阵向量进行特征提取,得到第一数量的初始特征向量;分别对各个初始特征向量进行降维,得到第一数量的目标特征向量;对第一数量的目标特征向量进行线性组合,得到目标码值。本发明将经过特征提取和降维后的目标特征向量进行进一步整合,能够最大程度的保留语义信息,降低数据存储消耗,可满足各种不同场景的应用需求。
-
公开(公告)号:CN112800183A
公开(公告)日:2021-05-14
申请号:CN202110212680.3
申请日:2021-02-25
申请人: 国网河北省电力有限公司电力科学研究院 , 国家电网有限公司
IPC分类号: G06F16/33 , G06F40/242 , G06F40/30
摘要: 本发明适用于数据处理技术领域,提供了一种内容名称数据处理方法及终端设备,上述方法包括:获取待处理内容名称数据,根据预设的查询词典将待处理内容名称数据转换为初始矩阵向量;对初始矩阵向量进行特征提取,得到第一数量的初始特征向量;分别对各个初始特征向量进行降维,得到第一数量的目标特征向量;对第一数量的目标特征向量进行线性组合,得到目标码值。本发明将经过特征提取和降维后的目标特征向量进行进一步整合,能够最大程度的保留语义信息,降低数据存储消耗,可满足各种不同场景的应用需求。
-