一种基于文本数据的金融舆情识别方法及系统

    公开(公告)号:CN113495959A

    公开(公告)日:2021-10-12

    申请号:CN202110551833.7

    申请日:2021-05-20

    申请人: 山东大学

    IPC分类号: G06F16/35 G06K9/62

    摘要: 本公开提供了一种基于文本数据的金融舆情识别方法及系统,获取新闻文本数据以及评论文本数据;对获取的文本数据进行预处理;根据预处理后的文本数据和预设Bert模型,提取新闻文本数据和评论文本数据中的表征向量集合;根据得到的表征向量集合和预设DE‑Former模型,得到舆情分类结果;本公开通过对客观新闻报道以及市场用户舆论的结合,从语义层次上实现了对于金融市场舆论情感的更准确判断。

    基于多头自注意力及LSTM的金融舆情分类方法及系统

    公开(公告)号:CN115952291A

    公开(公告)日:2023-04-11

    申请号:CN202310237468.1

    申请日:2023-03-14

    申请人: 山东大学

    摘要: 本发明涉文本数据处理技术领域,本发明公开了基于多头自注意力及LSTM的金融舆情分类方法及系统;其中所述方法,包括:获取待分类金融新闻全文文本数据以及评论文本数据;对获取的所有文本数据进行预处理;将预处理后的文本数据,输入到语义特征分割模型中进行语义分割,分别得到新闻全文文本的初始词嵌入向量和初始句嵌入向量,以及评论文本的初始词嵌入向量和初始句嵌入向量;将语义分割得到的结果,均输入到训练后的金融舆情分类模型中,输出金融舆情分类结果。实现从语义层次上对金融舆情的更准确判断。

    一种基于文本数据的金融舆情识别方法及系统

    公开(公告)号:CN113495959B

    公开(公告)日:2022-09-09

    申请号:CN202110551833.7

    申请日:2021-05-20

    申请人: 山东大学

    IPC分类号: G06F16/35 G06K9/62

    摘要: 本公开提供了一种基于文本数据的金融舆情识别方法及系统,获取新闻文本数据以及评论文本数据;对获取的文本数据进行预处理;根据预处理后的文本数据和预设Bert模型,提取新闻文本数据和评论文本数据中的表征向量集合;根据得到的表征向量集合和预设DE‑Former模型,得到舆情分类结果;本公开通过对客观新闻报道以及市场用户舆论的结合,从语义层次上实现了对于金融市场舆论情感的更准确判断。

    基于多头自注意力及LSTM的金融舆情分类方法及系统

    公开(公告)号:CN115952291B

    公开(公告)日:2023-07-18

    申请号:CN202310237468.1

    申请日:2023-03-14

    申请人: 山东大学

    摘要: 本发明涉文本数据处理技术领域,本发明公开了基于多头自注意力及LSTM的金融舆情分类方法及系统;其中所述方法,包括:获取待分类金融新闻全文文本数据以及评论文本数据;对获取的所有文本数据进行预处理;将预处理后的文本数据,输入到语义特征分割模型中进行语义分割,分别得到新闻全文文本的初始词嵌入向量和初始句嵌入向量,以及评论文本的初始词嵌入向量和初始句嵌入向量;将语义分割得到的结果,均输入到训练后的金融舆情分类模型中,输出金融舆情分类结果。实现从语义层次上对金融舆情的更准确判断。

    基于实体识别的金融领域舆情分析方法与系统

    公开(公告)号:CN115759104A

    公开(公告)日:2023-03-07

    申请号:CN202310024477.2

    申请日:2023-01-09

    申请人: 山东大学

    摘要: 本发明涉及数据处理技术领域,具体公开了一种基于实体识别的金融领域舆情分析方法及系统,方法包括:获取金融领域相关文本数据,并进行预处理;获取单一金融实体的金融相关文本集;基于设定时间段内提取的金融新闻正文文本特征与金融社区舆论特征,得到单一金融实体的当日舆情特征;提取设定日期范围内的行业相关政策特征以及单一金融实体的财报特征,并提取两者的综合特征;将单一金融实体的当日舆情特征与所述综合特征进行拼接;利用拼接后的特征,以及训练好的金融领域舆情分析模型,得到单一金融实体的舆情分析结果。本发明能够准确识别出单一的金融实体,充分利用不同类型的文本价值,实现对金融领域舆情的准确分析。

    基于实体识别的金融领域舆情分析方法与系统

    公开(公告)号:CN115759104B

    公开(公告)日:2023-09-22

    申请号:CN202310024477.2

    申请日:2023-01-09

    申请人: 山东大学

    摘要: 本发明涉及数据处理技术领域,具体公开了一种基于实体识别的金融领域舆情分析方法及系统,方法包括:获取金融领域相关文本数据,并进行预处理;获取单一金融实体的金融相关文本集;基于设定时间段内提取的金融新闻正文文本特征与金融社区舆论特征,得到单一金融实体的当日舆情特征;提取设定日期范围内的行业相关政策特征以及单一金融实体的财报特征,并提取两者的综合特征;将单一金融实体的当日舆情特征与所述综合特征进行拼接;利用拼接后的特征,以及训练好的金融领域舆情分析模型,得到单一金融实体的舆情分析结果。本发明能够准确识别出单一的金融实体,充分利用不同类型的文本价值,实现对金融领域舆情的准确分析。