一种中文地址分词及解析方法
    1.
    发明公开

    公开(公告)号:CN118485073A

    公开(公告)日:2024-08-13

    申请号:CN202410652274.2

    申请日:2024-05-24

    摘要: 本说明书实施例公开了一种中文地址分词及解析方法,本说明书实施例的分词方法包括:获取待分词的中文地址文本序列;将中文地址文本序列输入分词模型,输出标签序列;其中,分词模型对中文地址文本序列中的字符逐个进行预测,得到每个字符所对应的标签;所述分词模型为基于Logistic‑CRF算法实现的深度神经网络模型。本说明书实施例的解析方法包括:利用上述中文地址分词方法,对待解析的中文地址文本序列进行分词,得到该中文地址文本序列的标签序列;基于标签序列中的每个标签子序列,将与该标签子序列对应的中文地址子序列与行政区划标准名称表匹配;输出中文地址文本序列所匹配的若干行政区划标准名称和最后一级行政区划级别对应的行政区划编码。

    基于局部空间聚类模型的服务能力可达性计算方法及系统

    公开(公告)号:CN116502104A

    公开(公告)日:2023-07-28

    申请号:CN202310373387.4

    申请日:2023-04-10

    摘要: 本发明实施例提供一种基于局部空间聚类模型的服务能力可达性计算方法及系统,所述方法包括:采集交通大数据网络中的基础数据集;以未保机构的位置信息为圆心,确定道路网矢量数据中每段道路的时间成本,并基于时间成本确定预设时长内的可达范围;基于行政区域划分的区域边界,计算在区域边界内,未保机构的服务可达数值;获取目标地域内的行政区域划分,并结合未保机构的服务可达数据,对行政区域划分进行假设检验,并基于假设检验结果及对应表格,输出目标区域对应的服务现状及对策规则。采用本方法能够使用确定公共服务圈可达性,并将行政区域视角下的可达性作为属性,测度未保机构公共服务设施资源规划现状;为未保机构的规划提供参考依据。

    一种应对关系数据库入库瓶颈问题的处理方法

    公开(公告)号:CN111221829A

    公开(公告)日:2020-06-02

    申请号:CN201911116864.9

    申请日:2019-11-15

    发明人: 张鲁杭 陈益 李贵

    摘要: 本发明涉及一种应对关系数据库入库瓶颈问题的处理方法,针对MySQL每秒处理能力1000条,要达到15000条/秒的速度不切合实际的问题,本发明增加一个缓存功能,命名为“消息队列”,将获取的过量数据不入库,先放在消息队列里,然后再主动的定时通知平台进行入库。当消息队列中待写入库的数据依然会达到高峰期,处理的速度超过饱和状态,为了解决这个问题,本发明增加了多级仓库(硬盘),过几分钟就慢慢写到数据库里。最终目的,在低谷期将仓库里面的短信话单全部写在数据库里。本发明解决了关系数据库写入瓶颈问题,增加缓存策略,优化数据读取,提高平台性能。

    一种基于随机森林算法的心理健康预警分类方法及装置

    公开(公告)号:CN116313085A

    公开(公告)日:2023-06-23

    申请号:CN202310214387.X

    申请日:2023-03-08

    摘要: 本申请公开了一种基于随机森林算法的心理健康预警分类方法及装置,方法包括基于预警分类指标体系获取m组定量指标数据,得到标准预警结果;对定量指标数据进行特征转换处理,得到定量指标编码集合;从定量指标编码集合中提取出n组定量指标编码,并对n个基分类器进行训练;基于剩余的定量指标编码判断基分类器是否训练完成,并将目标指标编码输入至训练后的n个基分类器,根据n个预测预警结果确定出目标预警结果。通过制定预警分类指标体系来获取用户更加全面的指标数据,并结合多个经过训练的基分类器来得到精度更高的目标预警结果,不仅利用多个基分类器的随机性有效避免过拟合,还可保障指标数据在缺失时预测结果的可靠性以及准确性。