-
公开(公告)号:CN112597761A
公开(公告)日:2021-04-02
申请号:CN202011415777.6
申请日:2020-12-07
Applicant: 合肥工业大学
IPC: G06F40/216 , G06F40/242 , G06F40/30 , G06F16/33
Abstract: 本发明提供一种临时报告语义信息挖掘方法、装置、存储介质和电子设备,涉及自然语言处理技术领域。本发明基于获取的临时报告文本数据构建词表,再利用BERT模型训练词表中每个词的词向量,并基于每个词的词向量和其TFIDF值获取每个临时报告的文档向量,再由文档向量得到企业向量,并对企业向量进行降维,经过降维后剩余的企业向量维度即为临时报告语义信息。本发明弥补了现有技术中无法对临时报告进行信息挖掘的技术空缺,而且使得临时报告语义信息的挖掘自动化和精准有效。