-
公开(公告)号:CN115099241B
公开(公告)日:2024-04-12
申请号:CN202210772206.0
申请日:2022-06-30
Applicant: 郑州信大先进技术研究院
IPC: G06F40/30 , G06F40/289 , G06F40/216
Abstract: 本发明公开了一种基于模型融合的海量旅游网络文本语义分析方法,获取评论数据集,并对数据集中的数据进行预处理;对数据集中的数据进行可视化分析;对评论数据集采用DBSCAN密度聚类,获得数据集D1;利用Word2Vec模型,得到数据集D2;利用Simhash算法,得到数据集D3;利用N‑Gram语言模型得到数据集D4;将数据集D1‑D4中的数据结果综合得到数据集D5;将预处理之后的数据集D5导入TF‑IDF模型和LDA模型,提取得到关键词和主题词;词向量化计算每条评论的关键词向量与主题词向量之间的距离,并根据距离输出结果高的词;根据特色词、酒店名称、酒店类型相互组合构建三元组,得到知识图谱。
-
公开(公告)号:CN115099241A
公开(公告)日:2022-09-23
申请号:CN202210772206.0
申请日:2022-06-30
Applicant: 郑州信大先进技术研究院
IPC: G06F40/30 , G06F40/289 , G06F40/216
Abstract: 本发明公开了一种基于模型融合的海量旅游网络文本语义分析方法,获取评论数据集,并对数据集中的数据进行预处理;对数据集中的数据进行可视化分析;对评论数据集采用DBSCAN密度聚类,获得数据集D1;利用Word2Vec模型,得到数据集D2;利用Simhash算法,得到数据集D3;利用N‑Gram语言模型得到数据集D4;将数据集D1‑D4中的数据结果综合得到数据集D5;将预处理之后的数据集D5导入TF‑IDF模型和LDA模型,提取得到关键词和主题词;词向量化计算每条评论的关键词向量与主题词向量之间的距离,并根据距离输出结果高的词;根据特色词、酒店名称、酒店类型相互组合构建三元组,得到知识图谱。
-
公开(公告)号:CN114706932A
公开(公告)日:2022-07-05
申请号:CN202210335498.1
申请日:2022-03-31
Applicant: 郑州信大先进技术研究院
Abstract: 本发明实施例涉及信息获取技术领域,公开了一种地理信息加密脱敏及查询的方法和系统。该方法包括:接收第一用户输入的地址信息,通过加密方法对所述地址信息进行处理,得到多组地址标签;接收目标终端的查询请求,基于所述查询请求确定一组或多组目标地址标签,并解密所述目标地址标签,并解密后的相关信息发送给所述目标终端。实施本发明实施例,可以通过对地理信息转换为多组地址标签,一方面通过分组分级的加密方式实现信息脱敏,后台不存储用户的真实地址信息,另一方面根据查询权限来限定查询人查询到的信息,可以有效保证用户地址信息安全。
-
-