- 专利标题: 宫廷服饰文本主题生成方法、装置、电子设备及存储介质
-
申请号: CN201811184543.8申请日: 2018-10-11
-
公开(公告)号: CN109271519B公开(公告)日: 2022-04-22
- 发明人: 赵海英
- 申请人: 北京邮电大学
- 申请人地址: 北京市海淀区西土城路10号
- 专利权人: 北京邮电大学
- 当前专利权人: 北京邮电大学
- 当前专利权人地址: 北京市海淀区西土城路10号
- 代理机构: 北京柏杉松知识产权代理事务所
- 代理商 项京; 马敬
- 主分类号: G06F16/35
- IPC分类号: G06F16/35 ; G06F40/289
摘要:
本发明实施例提供了一种宫廷服饰文本主题生成方法、装置、电子设备及存储介质,其中,该方法包括:获取待处理的多个文本单元,分别对多个文本单元进行分词,得到每个文本单元对应的词集合,针对每个文本单元,计算该各文本单元对应的词集合中包括的各词的词频向量,并将各词的词频向量组合得到该文本单元的词频向量,根据每个文本单元的词频向量,通过狄利克雷算法,计算每个文本单元的主题向量,根据每两个文本单元的主题向量,对多个文本单元进行聚类,得到包含多个文本单元集合的聚类结果,针对每个文本单元集合,将该文本单元集合的文本单元包含的词中,词频向量大于预设词频向量门限值的词,作为对应各文本单元集合的主题。
公开/授权文献
- CN109271519A 宫廷服饰文本主题生成方法、装置、电子设备及存储介质 公开/授权日:2019-01-25