一种基于多源位置数据的城市人员分布计算方法与系统

    公开(公告)号:CN114374928A

    公开(公告)日:2022-04-19

    申请号:CN202111664627.3

    申请日:2021-12-31

    摘要: 本发明给出了一种基于多源位置数据的城市人员分布计算方法与系统,包括获取城市人员在一段时间内的移动轨迹数据、网络位置数据和WiFi连接数据;对移动轨迹数据根据时间进行排序得到轨迹数据集合,将轨迹数据集合中的位置点和时间相近的数据加入同一个集合中,计算出每个集合中城市人员所在的范围的中心点以及在中心点的停留时间,筛选出对应的停留时间最长的中心点作为城市人员的落脚点;将落脚点与网络位置数据和WiFi连接数据中的位置信息相比较,对落脚点进行更新,通过多次迭代分析出城市人员在所处城市的时间和空间分布。本发明可用于分析城市人员的活动轨迹、预测城市空间分布的各种可能性,从而优化社会资源部署。

    一种异构数据源采集方法和系统
    2.
    发明公开

    公开(公告)号:CN117311929A

    公开(公告)日:2023-12-29

    申请号:CN202311124015.4

    申请日:2023-09-01

    摘要: 公开了一种异构数据源采集方法和系统,包括主线程、一级线程和二级线程,其中,所述主线程包括:主线程池管理模块、主线程中断控制模块、时间片轮转控制模块、分组扫描模块,所述一级线程包括:一级线程池管理模块、一级线程中断响应模块、分组数据块扫描模块,所述二级线程包括二级线程中断处理模块、数据采集模块。本申请在系统资源有限的各数据源节点服务器上,结合时间片轮转方式,采用动态多级线程池公平调度的方法,对本地异构数据源的采集任务进行动态管理,合理分配系统时间片和线程资源,使得各类数据源在任务和数据等层面均得到相对公平的调度和处理。

    一种用于轻客户端的Spark作业提交方法和系统

    公开(公告)号:CN115934286A

    公开(公告)日:2023-04-07

    申请号:CN202211667536.X

    申请日:2022-12-23

    摘要: 公开了用于轻客户端的Spark作业提交方法和系统,包括动态代理接收到前端用户发送的作业处理请求,选择第一后端服务处理请求;第一后端服务将请求写入消息队列,通知前端用户请求提交成功进入调度队列等待处理;集群中空闲的第二后端服务从消息队列中获取请求,第二后端服务利用Spark驱动进程调用集执行器对请求进行调度执行,定时将处理进度、结果和采样数据写入NoSQL数据库;前端用户接收到请求提交成功信息后向动态代理发送获取实时进度和处理结果的请求,动态代理根据请求信息,选择第三后端服务处理,从数据库中获取实时进度和处理结果返回前端用户。本申请能够减轻边缘节点服务器的资源使用负担,降低故障发生频率,高效地实现轻客户端的交互效果。

    一种基于SQL实现机器学习算法的方法及系统

    公开(公告)号:CN117312357A

    公开(公告)日:2023-12-29

    申请号:CN202311124131.6

    申请日:2023-09-01

    摘要: 本申请提供了一种基于SQL实现机器学习算法的方法及系统,提高了机器学习算法的执行效率和可维护性,通过将SQL语句转化为机器学习算法的执行流程,在SQL语句中嵌入机器学习算法的逻辑,以实现数据处理、特征工程、模型训练和预测等一系列机器学习任务。与传统的机器学习算法相比,具有更高的灵活性和可扩展性,能够在不同数据源和数据类型之间进行快速切换,实现了机器学习和数据处理的无缝集成,简化了机器学习任务的编码过程,同时降低了算法实现的复杂度和开发成本。并且,本申请的方法还支持在分布式计算环境下进行大规模的机器学习任务,通过利用计算引擎的优化能力和分布式计算框架的并行处理机制可以提高任务的执行效率。

    一种基于多源位置数据的城市人员分布计算方法与系统

    公开(公告)号:CN114374928B

    公开(公告)日:2023-12-19

    申请号:CN202111664627.3

    申请日:2021-12-31

    摘要: 本发明给出了一种基于多源位置数据的城市人员分布计算方法与系统,包括获取城市人员在一段时间内的移动轨迹数据、网络位置数据和WiFi连接数据;对移动轨迹数据根据时间进行排序得到轨迹数据集合,将轨迹数据集合中的位置点和时间相近的数据加入同一个集合中,计算出每个集合中城市人员所在的范围的中心点以及在中心点的停留时间,筛选出对应的停留时间最长的中心点作为城市人员的落脚点;将落脚点与网络位置数据和WiFi连接数据中的位置信息相比较,对落脚点进行更新,通过多次迭代分析出城市人员在所处城市的时间和空间分布。本发明可用于分析城市人员的活动轨迹、预测城市空间分布的各种可能性,从而优化社会资源部署。

    一种用户自定义函数的实现方法和系统

    公开(公告)号:CN115964050A

    公开(公告)日:2023-04-14

    申请号:CN202211669162.5

    申请日:2022-12-23

    摘要: 公开了用户自定义函数的实现方法和系统,包括系统服务接口接受并解析从用户提交的Flink SQL任务及UDF请求参数;响应于用户提交的UDF请求参数中仅提供UDF唯一标识,从系统缓存中获取UDF唯一标识;响应于UDF请求参数中提供了UDF源码,根据UDF源码获取对应开发语言的解释器或编译器,将一或多个使用不同语言开发的UDF源码从文本形式动态转换为JVM对象,并向Flink SQL运行时环境注册JVM对象所指向的UDF函数;响应于成功执行UDF相关Flink SQL任务,将UDF源码相关信息进行持久化存储,同时将UDF唯一标识写入系统缓存。本申请可以减少持久化存储的远程连接开销,解决UDF重复编译问题,加快调试效率,解决不同技术领域的研发人员和普通用户协同开发难题。

    一种旅游评论分析方法与系统
    8.
    发明公开

    公开(公告)号:CN115203417A

    公开(公告)日:2022-10-18

    申请号:CN202210843636.7

    申请日:2022-07-18

    摘要: 本发明给出了一种旅游评论分析方法与系统,包括通过抓取旅游评论的文本构成训练集,利用卷积神经网络的卷积层对训练集中的文本从主题和情感两个维度进行特征提取,分别获得主题特征和情感特征;在所述卷积神经网络中分别对所述主题特征和所述情感特征进行池化成为两列向量;再利用所述卷积神经网络的全连接层把所述两列向量合并起来组成一个矩阵之后,再对所述矩阵的两列向量分别进行分类训练后输出结果,从而得到主题和情感两个维度各自的分类结果;保存所述卷积神经网络的模型,利用所述模型对需要分析的旅游评论的文本计算其分别属于所述两个维度的各个分类的评论数量,并分析计算结果。本发明实现了多维度的文本分析,同时得到直观的结果。