宫廷服饰文本主题生成方法、装置、电子设备及存储介质
摘要:
本发明实施例提供了一种宫廷服饰文本主题生成方法、装置、电子设备及存储介质,其中,该方法包括:获取待处理的多个文本单元,分别对多个文本单元进行分词,得到每个文本单元对应的词集合,针对每个文本单元,计算该各文本单元对应的词集合中包括的各词的词频向量,并将各词的词频向量组合得到该文本单元的词频向量,根据每个文本单元的词频向量,通过狄利克雷算法,计算每个文本单元的主题向量,根据每两个文本单元的主题向量,对多个文本单元进行聚类,得到包含多个文本单元集合的聚类结果,针对每个文本单元集合,将该文本单元集合的文本单元包含的词中,词频向量大于预设词频向量门限值的词,作为对应各文本单元集合的主题。
0/0