基于混合相似度的文献主题分类方法、装置、设备及介质
摘要:
本申请涉及一种基于混合相似度的文献主题分类方法、装置、设备及介质,属于大数据技术领域,解决了现有技术中对于文献集合内容的主题类别划分存在忽略文献内容关联和作者关联等因素而导致精度较低的问题。本申请技术方案主要包括:获取文献实体异构网络集合,所述文献实体异构网络集合至少包括文献文本、文献作者以及文献间的引文网络信息;根据所述文献文本、所述文献作者以及所述引文网络信息进行指标评价,并进行融合以生成混合相似度指标;根据所述混合相似度指标对所述文献实体异构网络集合中的文献进行聚类分析以获得若干文献簇;依据各所述文献簇中文献的特征向量和所述(56)对比文件褚晓泉 等.基于智能情报挖掘的技术甄别发展现状及趋势预测研究《.工程管理科技前沿》.2022,第41卷(第3期),7-14.席崇俊 等. 基于异构信息网络的科技文献主题识别研究《.文献与数据学报》.2022,第4卷(第3期),66-78.Cezar Sas et al..Using Structural andSemantic Information to Identify SoftwareComponents《.2021 IEEE InternationalConference on Software Analysis,Evolution and Reengineering (SANER)》.2021,546-550.Meysam Asgari-Chenaghlu etal..TopicBERT: A cognitive approach fortopic detection from multimodal poststream using BERT and memory–graph.《Chaos, Solitons and Fractals》.2021,1-13.
0/0