基于神经网络的语言模型训练方法和装置

    公开(公告)号:CN108694443B

    公开(公告)日:2021-09-17

    申请号:CN201710217479.8

    申请日:2017-04-05

    IPC分类号: G06N3/08

    摘要: 本发明涉及基于神经网络的语言模型训练方法和装置。该方法包括:针对训练集中的每一个目标词,利用噪声生成网络生成目标词特征和噪声词特征,其中,目标词特征和噪声词特征具有各自对应的类别标签;利用上下文神经网络提取目标词的上下文特征;将目标词特征、噪声词特征以及上下文特征构成训练样本输入二分类器;迭代更新噪声生成网络的参数和上下文神经网络的参数,直到二分类器的预测误差接近预定值时停止更新;以及用训练得到的上下文神经网络作为语言模型。根据本发明的方法和装置可以训练得到一种收敛速度较快同时泛化能力较好的语言模型。

    信息处理方法和基于文本生成图像的装置

    公开(公告)号:CN108959322A

    公开(公告)日:2018-12-07

    申请号:CN201710379515.0

    申请日:2017-05-25

    IPC分类号: G06F17/30 G06K9/62

    CPC分类号: G06K9/6256

    摘要: 本发明公开了信息处理方法和基于文本生成图像的装置。所述方法包括:从样本文本中提取表征样本文本中的词之间的关联性的文本特征;以尺寸变化的窗口来选择性地截取文本特征的各个局部,以得到各个局部文本特征;基于样本文本的各个局部文本特征和与样本文本对应的样本图像来训练图像生成模型,其中,图像生成模型包括编码器模块和解码器模块,训练后的图像生成模型中的解码器模块根据所输入的文本的各个局部文本特征来迭代地生成与所输入的文本对应的图像,并且各个局部文本特征分别在各次迭代中截取。

    信息处理方法和装置以及信息检测方法和装置

    公开(公告)号:CN108875758A

    公开(公告)日:2018-11-23

    申请号:CN201710320880.4

    申请日:2017-05-09

    IPC分类号: G06K9/62 G06N3/02

    摘要: 公开了一种信息处理方法和装置以及信息检测方法和装置,其中信息处理方法包括:从多个样本图像中的每个样本图像提取具有预定宽度和预定高度的一组特征图,其中,一组特征图中的特征图分别与不同的图像特征相对应;以及基于所提取的一组特征图和为多个样本图像标记的文字描述来训练文字描述模型,文字描述模型用于根据输入图像生成相应文字描述,其中,训练文字描述模型包括基于一组特征图和循环神经网络模型的前一状态向量,计算一组特征图上的关注窗口的中心和大小。根据本公开的实施例,能够产生图像的更合适的文字描述。

    信息处理装置、信息处理方法以及信息处理设备

    公开(公告)号:CN107305565A

    公开(公告)日:2017-10-31

    申请号:CN201610251752.4

    申请日:2016-04-21

    IPC分类号: G06F17/30

    CPC分类号: G06F16/35 G06F16/285

    摘要: 本公开提供了信息处理装置、信息处理方法以及信息处理设备。信息处理装置包括:预分类单元,其利用分类器对非标记样本数据进行分类,以获得所述非标记样本数据的预分类标签;聚类单元,其对所述非标记样本数据进行聚类,以获得所述非标记样本数据的至少一个簇;标签修改单元,针对所述至少一个簇中的每个簇,利用标签修改优化处理,基于该簇中的非标记样本数据的一个或多个预分类标签获得针对该簇的优化标签,并将该簇中的非标记样本数据的预分类标签全部修改为该优化标签;以及优化单元,其利用所述非标记样本数据以及所述优化标签,对所述分类器进行优化。

    时序文件的分类方法和分类系统

    公开(公告)号:CN106202128A

    公开(公告)日:2016-12-07

    申请号:CN201510232775.6

    申请日:2015-05-08

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种时序文件的分类方法和分类系统。根据本发明的一个方面,时序文件的分类方法包括:从多个时序文件中提取时序特征;根据所提取的时序特征计算每个时序文件的状态统计向量,其中所述状态统计向量中的元素反映了相应时序文件的状态统计结果;利用所述多个时序文件的状态统计向量构建特征矩阵;以及根据所述特征矩阵对所述多个时序文件进行分类。由此,可以利用状态统计信息对时序文件进行分类,从而确保了分类结果的可靠性,并能够简化计算复杂度,从而实现快速且准确的分类。

    动作评价的方法和装置
    6.
    发明公开

    公开(公告)号:CN108686363A

    公开(公告)日:2018-10-23

    申请号:CN201710232620.1

    申请日:2017-04-11

    IPC分类号: A63B71/06

    摘要: 本发明涉及动作评价方法和装置。该方法包括:从通过传感器采集的记录中抽取特征,记录包含一个动作的多个数据点;确定所抽取的特征中包括的多个基本动作;利用预先存储的评价模型确定用于对所抽取的特征中包括的多个基本动作进行评价的评价状态序列;以及将所确定的评价状态序列与预先存储的标准评价状态序列进行比较来得到对记录的评价值。根据本发明的方法和装置可以准确地对每个动作进行评价,从而判断用户的某个动作做的是否规范,进而知道如何改进。此外,还可以解决由于握拍的方向不同而导致的传感器采集来的数据不同的问题。

    动作识别方法及其装置
    7.
    发明公开

    公开(公告)号:CN107728775A

    公开(公告)日:2018-02-23

    申请号:CN201610653994.6

    申请日:2016-08-10

    IPC分类号: G06F3/01 G06K9/00 G06K9/62

    摘要: 本发明公开了一种动作识别方法及其装置。该动作识别方法包括:将与待识别的用户动作有关的依时序排列的数据串分割成具有固定时长的多个数据段;针对每一个数据段,将该数据段细分成彼此不重叠的多个子段,计算各个子段中的各个时间点处的数据相对于参考时间点处的数据的相对位置关系,以及依时序将所计算的相对位置关系连接在一起作为该数据段的数据段特征;以及通过预先训练的分类器,基于与待识别的用户动作有关的数据串所包括的所有数据段的数据段特征来识别用户动作。根据本发明的方法及装置能够识别复杂的动作。

    时序特征的优化方法和优化装置

    公开(公告)号:CN106326911A

    公开(公告)日:2017-01-11

    申请号:CN201510394629.3

    申请日:2015-07-07

    IPC分类号: G06K9/62

    CPC分类号: G06K9/6218

    摘要: 本发明公开了一种时序特征的优化方法和优化装置。该优化方法包括:将多个时序特征进行组合,以形成多个特征组合,其中每个特征组合中均具有预定数量的时序特征;计算每个特征组合的重要度向量;根据每个特征组合的重要度向量,对所述多个特征组合进行聚类,以形成多个类;以及在所述多个类中选取所述多个时序特征中的一部分时序特征。该优化方法通过将时序特征进行组合并计算组合的重要度向量,并且以此为依据对特征组合进行聚类,从而将相关的特征聚为同一类,在每个类中可适当地选取时序特征,以用于机器学习。如此,可优化用于机器学习的时序特征,使得所选取的时序特征更加有利于机器学习的效果。

    模型融合方法、模型融合设备和分类方法

    公开(公告)号:CN106156161A

    公开(公告)日:2016-11-23

    申请号:CN201510179002.6

    申请日:2015-04-15

    IPC分类号: G06F17/30

    摘要: 公开了一种模型融合方法、模型融合设备和分类方法,该模型融合方法包括:分类阈值确定步骤,确定多个分类模型中的每个的用于对多个训练样本进行分类的分类阈值;空间划分步骤,针对多个分类模型中的每个,将该分类模型关于多个训练样本的输出得分根据各个输出得分的概率密度划分成多个子空间;置信度确定步骤,针对多个分类模型中的每个,基于所划分的多个子空间,确定多个子空间内的各个单元的置信度,该置信度表示各个单元的输出得分的置信水平;以及分类阈值融合步骤,基于多个分类模型中的每个的预定权重和各个分类模型的分类阈值,对多个分类模型的分类阈值进行融合。根据本公开的实施例,可以有效地实现多模型融合,以优化分类性能。

    数据处理装置及数据处理方法

    公开(公告)号:CN105654102A

    公开(公告)日:2016-06-08

    申请号:CN201410643379.8

    申请日:2014-11-10

    IPC分类号: G06K9/62 G06N5/02

    摘要: 本申请公开了一种用于多模型系统中的模型融合的数据处理装置和数据处理方法,该数据处理装置包括:特征空间划分单元,被配置为将待测数据集的特征空间分割为多个特征空间划分,以使得该特征空间划分对于多个模型中的至少一个模型而言是优化的;融合单元,被配置为基于训练数据集获得特征空间上的至少由多个模型的子集融合得到的融合模型,其中,融合单元以特征空间划分为单位来获得新特征空间划分模式,同时针对新特征空间划分模式以及各个新特征空间划分使用的、作为多个模型的子集的模型子集两者进行优化,以获得针对整个特征空间的融合模型的整体最佳性能。