酒店选址模型建立方法、酒店选址方法及酒店选址系统

    公开(公告)号:CN118586550A

    公开(公告)日:2024-09-03

    申请号:CN202410703403.6

    申请日:2024-06-03

    摘要: 本发明公开了一种酒店选址模型建立方法,其包括:步骤S1、收集若干选址人的选址决策经验数据;步骤S2、利用选址决策经验数据构建知识图谱;步骤S3、根据知识图谱的关联性选取可收集的时空数据,时空数据用于后续模型的训练;步骤S4、将收集到的时空数据形成一个三维张量X;步骤S5、利用三维张量X生成训练集,通过训练集训练智慧城市生成型预训练变换模型;步骤S6、训练后的智慧城市生成型预训练变换模型形成酒店选址模型。本发明还提供一种基于上述模型的酒店选址系统和方法。与现有技术相比,本发明的有益效果在于:其能够依据知识图谱所形成的专家经验进行高效决策,且决策路径可见,有效解决酒店选址场景中已标注时空数据缺乏的问题。

    一种中文地址分词及解析方法
    4.
    发明公开

    公开(公告)号:CN118485073A

    公开(公告)日:2024-08-13

    申请号:CN202410652274.2

    申请日:2024-05-24

    摘要: 本说明书实施例公开了一种中文地址分词及解析方法,本说明书实施例的分词方法包括:获取待分词的中文地址文本序列;将中文地址文本序列输入分词模型,输出标签序列;其中,分词模型对中文地址文本序列中的字符逐个进行预测,得到每个字符所对应的标签;所述分词模型为基于Logistic‑CRF算法实现的深度神经网络模型。本说明书实施例的解析方法包括:利用上述中文地址分词方法,对待解析的中文地址文本序列进行分词,得到该中文地址文本序列的标签序列;基于标签序列中的每个标签子序列,将与该标签子序列对应的中文地址子序列与行政区划标准名称表匹配;输出中文地址文本序列所匹配的若干行政区划标准名称和最后一级行政区划级别对应的行政区划编码。

    基于文本的旅游实体识别方法、系统、设备及存储介质

    公开(公告)号:CN118333060A

    公开(公告)日:2024-07-12

    申请号:CN202410533177.1

    申请日:2024-04-29

    摘要: 本发明提供了基于文本的旅游实体识别方法、系统、设备及存储介质,该方法包括:建立地理类信息索引库以及包含地址信息的景点类信息索引库、酒店类信息索引库;对于待识别文本进行语义识别,获得地理类实体文本和机构类实体文本;将地理类实体文本在地理类信息索引库进行匹配,获得第一地理实体信息;对机构类实体文本进行分类,获得第一机构类实体文本和第二机构类实体,分别在景点类信息索引库和酒店类信息索引库中进行匹配,获得景点实体信息和酒店实体信息;仅将地址信息归属于第一地理实体信息的景点实体信息和/或酒店实体信息作为识别结果。本发明能够通过匹配实体地理位置上的关联与过滤,大大提升了文本实体识别的准确率。

    地址相似度计算方法、装置、设备及存储介质

    公开(公告)号:CN118296405A

    公开(公告)日:2024-07-05

    申请号:CN202410719381.2

    申请日:2024-06-05

    发明人: 尹民 程艾 刘亚庆

    摘要: 本发明公开了一种地址相似度计算方法、装置及存储介质,方法包括:利用BERT模型,从多字段地址数据中提取出语料特征,并转化为结构化标准地址的文本特征向量;根据不同字段在地址中的重要程度以及BERT模型训练中的特征表现,为各字段设定相应的权值,以便在相似度计算阶段综合考虑各部分的影响;根据文本特征向量利用余弦相似度方法计算中文文本以及其对应拼音的相似度,以双维度衡量地址间的相似性;基于中文文本以及其对应拼音的相似度,确定多字段文本的综合相似度,并设定阈值判断两个多字段文本是否相似;本发明方法不仅提升了在面对多字段地址匹配任务时的成功率,而且有效地解决了长文本中有效地址提取准确率低的问题。

    地址信息检测方法、装置、电子设备和存储介质

    公开(公告)号:CN113434708B

    公开(公告)日:2024-07-02

    申请号:CN202110573656.2

    申请日:2021-05-25

    发明人: 邹庆言

    摘要: 本公开提供了地址信息检测方法、装置、电子设备和存储介质,涉及数据处理领域,尤其涉及人工智能技术领域。具体实现方案为:获取初始地址,并对所述初始地址进行分词处理,得到级别地址;对所述级别地址进行异常检测,得到所述初始地址的异常检测结果,以及对应的异常类型。本公开实施例可以提高地址信息的检测准确率。

    一种OTT位置信息的获取方法
    10.
    发明公开

    公开(公告)号:CN118132771A

    公开(公告)日:2024-06-04

    申请号:CN202410250096.0

    申请日:2024-03-05

    发明人: 赵先明 向阳 林昀

    摘要: 本申请涉及通信领域,公开了一种OTT位置信息的获取方法,包括以下步骤:S1、从OTT服务中收集数据;S2、对所述数据进行预处理以形成预处理数据;S3、对所述预处理数据执行自动化关键字发现;S4、基于自动化关键字发现的结果,对关键字进行评分和选择;S5、利用深度学习模型处理评分和选择后的关键字以识别位置信息;S6、将识别的位置信息转化为地理坐标。所述数据包括文本、音频或视频内容。所述预处理包括数据清洗、分词和向量化。本发明通过利用深度学习模型和自动化关键字发现技术,实现对OTT服务数据的自动处理和位置信息的自动识别。减少了人工处理的工作量和时间成本。