基于标签组对数据进行混合的方法和设备
摘要:
公开了基于标签组对数据进行混合的方法和设备。该方法包括:在多个同义标签集中确定标签组的每个标签所属的同义标签集;生成与标签组相对应的特征向量,在所生成的特征向量中,每个元素分别与多个同义标签集中的不同同义标签集相对应,每个元素的值为标签组中属于与元素相对应的同义标签集的标签的数目;计算特征向量与至少一个类中每个类的核心特征向量之间的相似度,其中类的核心特征向量的每个元素的值是已经被分类到类中的每个标签组的对应特征向量中的相应元素的值的和;根据所计算出的相似度,将标签组分类到至少一个类中接近的类中;以及将同一类中每个标签组的每个标签分别替换为其所属的同义标签集中的指定标签。
公开/授权文献
0/0