领域自适应的观点数据分类方法及装置

    公开(公告)号:CN106294506A

    公开(公告)日:2017-01-04

    申请号:CN201510316353.7

    申请日:2015-06-10

    IPC分类号: G06F17/30

    摘要: 本发明公开一种领域自适应的观点数据分类方法,属于互联网技术领域。包括:确定源领域检索词矩阵及目标领域检索词矩阵;确定源领域目标函数及目标领域目标函数;根据源领域目标函数及目标领域目标函数确定总目标函数;分别确定总目标函数中各个参数的目标值;根据各个参数的目标值及源领域中的已标注观点数据,训练指定分类模型,通过训练得到的指定分类模型对目标领域的观点数据进行分类。由于总目标函数与源领域特定话题矩阵、目标领域特定话题矩阵及表示源领域与目标领域间的共享话题的枢纽矩阵有关,从而提供一种借助共享话题实现领域自适应的观点数据分类方法。由于共享话题能够减小源领域与目标领域间的差异,从而可确保分类结果的准确性。

    项集挖掘方法及装置
    22.
    发明公开

    公开(公告)号:CN106294494A

    公开(公告)日:2017-01-04

    申请号:CN201510310487.8

    申请日:2015-06-08

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种项集挖掘方法及装置,属于数据挖掘技术领域。所述方法包括:获取自定义的最低效用阈值、价格表和折扣表;价格表中包含各个数据项对应的成本价和售价;折扣表中包含各个数据项对应的折扣类型和折扣参数;对于数据库中的各个项集,根据项集中包含的数据项对应的成本价、售价、折扣类型和折扣参数,计算项集的实际效用值,该项集包含至少一个数据项;当实际效用值≥最低效用阈值时,确定项集为高效用项集。本发明达到了结合数据项对应的折扣策略,使得计算出的数据库中项集的实际效用值更加准确,从而提高挖掘出的高效用项集的实际使用价值的效果。

    恶意用户识别方法及装置

    公开(公告)号:CN104811424A

    公开(公告)日:2015-07-29

    申请号:CN201410037848.1

    申请日:2014-01-26

    IPC分类号: H04L29/06

    CPC分类号: H04L63/1416

    摘要: 一种恶意用户识别方法,包括:获取全局用户的用户标识,计算其对应的信用度,根据全局用户的用户标识对应的信用度生成全局用户信用分布;根据查询条件在全局用户的用户标识中筛选得到条件用户的用户标识;获取条件用户的用户标识对应的信用度,根据条件用户的用户标识对应的信用度生成条件用户信用分布;在全局用户信用分布和条件用户信用分布中分别获取其信用度大于信用度阈值的全局优质用户数以及条件优质用户数;获取预设的优质用户数阈值,计算全局优质用户数与条件优质用户数的差值,根据差值和优质用户数阈值判断查询条件是否对应恶意用户。上述恶意用户识别方法能够提高识别的准确性。

    一种数据查询的方法和装置

    公开(公告)号:CN104765790A

    公开(公告)日:2015-07-08

    申请号:CN201510131306.5

    申请日:2015-03-24

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种数据查询的方法和装置,属于计算机技术领域。所述方法包括:基于预设编码算法,确定数据库中的数值型数据对应的编码;根据数据库中各数值型数据对应的编码,建立位向量查询树;当接收到携带有数值范围条件的查询请求时,基于所述预设编码算法,分别确定所述数值范围条件中上限的数值型数据对应的第一编码以及下限的数值型数据对应的第二编码;根据所述位向量查询树,以及所述第一编码和所述第二编码进行按位与处理得到的第三编码,查询所述数据库中符合所述查询请求的数值型数据。采用本发明,可以提高数据查询的效率。

    一种历史垃圾消息的识别方法及系统

    公开(公告)号:CN103324617A

    公开(公告)日:2013-09-25

    申请号:CN201210074406.5

    申请日:2012-03-20

    发明人: 周斌 刘婷婷

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明适用于互联网络技术领域,提供了一种历史垃圾消息的识别方法及系统,所述方法包括下述步骤:当接收到浏览指定网页的请求时,提取所述指定网页的内容特征信息,根据预设知识库中存储的特征识别算法,将所述指定网页的内容特征信息与所述预设知识库中存储的特征信息进行匹配识别,获取识别结果,根据所述识别结果,识别所述指定网页中的信息是否属于历史垃圾消息,本发明通过基于读审核对网页中的历史垃圾消息进行识别,使得识别成本得到降低、识别率、实时性及自适应性得到提高。

    触觉传感器、压力事件检测方法和装置及智能机器人

    公开(公告)号:CN114252178B

    公开(公告)日:2024-03-01

    申请号:CN202011021465.7

    申请日:2020-09-25

    IPC分类号: G01L1/12

    摘要: 本申请公开了一种触觉传感器、压力事件检测方法和装置及智能机器人,涉及传感器技术领域,用于提升触觉传感器的压力事件检测的准确性。该触觉传感器在存在压力事件时,导线在压力作用下切割磁性层的磁感线,产生感应电流使得电致发光器件发光,光线进入光波导之后,被光信号接收器接收,同时电信号接收器检测到导线上的电信号,因而通过电磁学原理输出外力位置,利用光学原理输出外力的大小,降低电磁干扰对于外力估计的干扰问题,同时电流使得电致发光器件发出的光进入光波导的入射光强大致相等,降低不同入射光强导致的外力估计不准确的概率,从而提升了触觉传感器的压力事件检测的准确性。

    属性词识别及其层次构建方法、装置、设备及存储介质

    公开(公告)号:CN109492214B

    公开(公告)日:2023-09-19

    申请号:CN201710813362.6

    申请日:2017-09-11

    IPC分类号: G06F40/284

    摘要: 本发明提供一种属性词识别方法及装置,包括:获取评论语料的名词词表;获取上下位关系矩阵,所述上下位关系矩阵为种子词与种子词的下位词的上下位关系的矩阵;根据所述上下位关系矩阵及所述名词词表中的各词,确定所述名词词表中各词的预测上位词向量,所述预测上位词向量为所述上下位关系矩阵与词的词向量的乘积;根据各词的所述预测上位词向量确定种子词的属性词。该方法及装置,仅需通过少量人力资源确定种子词,而无需通过大量的人力资源,便可以确定与种子词相关的属性词,从而降低了人力资源消耗量。本发明还提供一种与上述属性词识别方法及装置对应的属性词的层次构建方法及装置,以及一种计算机设备及计算机存储介质。

    数据处理请求的处理方法、装置、存储介质及电子装置

    公开(公告)号:CN110119307B

    公开(公告)日:2022-09-13

    申请号:CN201810111838.6

    申请日:2018-02-05

    IPC分类号: G06F9/50

    摘要: 本发明公开了一种数据处理请求的处理方法、装置、存储介质及电子装置。其中,该方法包括:获取并发的多个数据处理请求对应的运行参数,其中,运行参数包括:运行时间和运行带宽;按照运行时间从小到大的顺序确定多个数据处理请求中的每个数据处理请求的处理顺序,其中,在多个数据处理请求中,运行时间较小的数据处理请求被设置为优先于运行时间较大的数据处理请求被处理;在轮到处理多个数据处理请求中的目标数据处理请求、且目标数据处理请求对应的目标运行带宽满足目标运行条件的情况下,处理目标数据处理请求。本发明解决了数据处理请求的处理效率较低的技术问题。

    唇语识别模型的处理方法、装置、计算机设备和存储介质

    公开(公告)号:CN113822125A

    公开(公告)日:2021-12-21

    申请号:CN202110703815.6

    申请日:2021-06-24

    IPC分类号: G06K9/00 G06K9/62

    摘要: 本申请涉及一种唇语识别模型的处理方法、装置、计算机设备和存储介质。所述方法涉及人工智能的计算机视觉技术,将整个蒸馏过程划分为交替训练的学生训练阶段与大师训练阶段,在大师训练阶段,利用临时训练样本对前次交替训练更新的学生模型再次更新,获得的临时学生模型通过验证样本向大师模型反馈当前的学习状态,引导大师模型根据当前反馈自适应地调整教学知识;此外,大师模型还接受大师训练样本的监督,通过大师训练样本所确定的大师识别损失来调整教学内容。接着在学生训练阶段对学生模型进行训练,如此反复迭代多次之后根据学生模型获得唇语识别模型。上述方案能够在提升大师模型教学知识准确性的同时灵活调整教学内容,提升知识蒸馏效果。