临时报告语义信息挖掘方法、装置、存储介质和电子设备

    公开(公告)号:CN112597761A

    公开(公告)日:2021-04-02

    申请号:CN202011415777.6

    申请日:2020-12-07

    Abstract: 本发明提供一种临时报告语义信息挖掘方法、装置、存储介质和电子设备,涉及自然语言处理技术领域。本发明基于获取的临时报告文本数据构建词表,再利用BERT模型训练词表中每个词的词向量,并基于每个词的词向量和其TFIDF值获取每个临时报告的文档向量,再由文档向量得到企业向量,并对企业向量进行降维,经过降维后剩余的企业向量维度即为临时报告语义信息。本发明弥补了现有技术中无法对临时报告进行信息挖掘的技术空缺,而且使得临时报告语义信息的挖掘自动化和精准有效。

Patent Agency Ranking