一种基于优先级的实时ID拉通引擎方法

    公开(公告)号:CN109446215B

    公开(公告)日:2022-04-12

    申请号:CN201811294114.6

    申请日:2018-10-31

    Abstract: 本发明公开了一种基于优先级的实时ID拉通引擎方法,包括如下步骤:S1、ID拉通引擎从kafka中获取实时的消费行为日志数据,并从行为日志数据中提取出所有的ID,然后找到mainID;每条行为日志数据中,mainID将会与除它自己之外的其它ID分别建立ID关系,即每条行为日志数据产出的ID关系的条数为n‑1,n为该行为日志数据中ID的数量;S2、根据步骤S1中生成的ID关系,更新数据库中ID关系的权重;S3、根据ID优先级由高到低的排序,逐级计算当前层级的ID的SuperID归属的变更。使用本发明的用户ID拉通解决方案,可以解决用户ID随着时间推移而变化这一现实问题;同时,准实时的实现(5s内)也可以满足互联网中推荐等其它技术的实时需求。

    检测数据源连接的方法、装置、存储介质及电子设备

    公开(公告)号:CN110855526B

    公开(公告)日:2022-03-29

    申请号:CN201911143589.X

    申请日:2019-11-20

    Abstract: 本公开涉及一种检测数据源连接的方法、装置、存储介质及电子设备,首先获取待检测的目标数据源的连接地址信息,然后根据所述连接地址信息进行telnet验证,得到所述客户端与所述目标数据源的网络服务连通结果,所述网络服务连通结果用于表示所述客户端与所述目标数据源之间的网络是否连通,若所述网络服务连通结果表示所述客户端与所述目标数据源之间的网络不连通,输出第一提示信息,所述第一提示信息用于提示用户所述客户端与所述目标数据源之间的网络不连通。

    一种全生命周期数据地图生成系统、方法

    公开(公告)号:CN112732987A

    公开(公告)日:2021-04-30

    申请号:CN202011642227.8

    申请日:2020-12-31

    Abstract: 本申请公开一种全生命周期数据地图生成系统,由多源异构数据接入任务获取数据源的数据,由数据转换任务、数据治理任务和多样化数据处理脚本任务分别确定第一血缘关系、第二血缘关系和第三血缘关系,由数据源表多维统计任务确定第一数据和第二数据在指定分析维度下的信息;由数据地图生成模块根据该些血缘关系和所述指定分析维度下的信息生成数据地图并展示,从而解决了现有技术中的数据地图生成与展示方式,无法生成并展示不同分析维度下的信息和多源数据之间的血缘关系的问题,有效丰富数据地图的信息展示分析维度,提升数据地图信息的分析结果的适用宽度。本申请还公开一种全生命周期数据地图生成方法。

    一种新闻专题事件发现的方法

    公开(公告)号:CN110162632B

    公开(公告)日:2021-04-09

    申请号:CN201910414328.0

    申请日:2019-05-17

    Abstract: 本发明公开了一种新闻专题事件发现的方法,主要包括:S1、对每篇给定的新闻文章进行事件主题句识别;S2、对每篇给定的新闻文章进行事件核心元素抽取;S3、利用步骤S2中提取的每篇新闻文章的事件核心元素判别文章相似性。本发明方法基于事件元素抽取(Event extraction)技术、话题追踪检测(Topic Detection and Tracking)、事件关系发现及专题新闻增量追加技术,来实现新闻文本的专题事件发现和聚类,实现新闻文本的基于话题进行专题聚类和发现的方法,使用者无需提供标注训练数据,也无需提供事件类型模板,无需了解相关领域知识,即可实现高质量的专题聚类和事件发现。

    显示任务流的方法、装置、可读存储介质及电子设备

    公开(公告)号:CN111352686B

    公开(公告)日:2023-10-03

    申请号:CN202010144858.0

    申请日:2020-03-04

    Abstract: 本公开涉及一种显示任务流的方法、装置、可读存储介质及电子设备。方法包括:响应于接收到任务流显示请求,获取目标图形基础库;获取任务流中每个任务的属性信息,属性信息包括时间信息、状态信息和席位信息;按照时间信息、状态信息、席位信息与所述目标图形基础库中的三维坐标轴中每一坐标轴的对应关系,在电子设备的显示界面中显示任务流。这样,将任务流的时间信息、状态信息和席位信息以三维坐标轴的方式显示在电子设备的显示界面中,不仅可以显示出任务流在时间和状态维度下的变化,还可以显示出任务流在不同执行人之间的传递,以实现全流程监督把控,便于用户获知任务流中每个任务的上下游状态,进而及时做出决策,提高任务完成的效率。

    文本校对方法、装置、计算机可读存储介质及电子设备

    公开(公告)号:CN110929514B

    公开(公告)日:2023-06-27

    申请号:CN201911144534.0

    申请日:2019-11-20

    Abstract: 本公开涉及一种文本校对方法、装置、计算机可读存储介质及电子设备。方法包括:确定待校对文本中各句子的纠错信息,纠错信息包括错误词和其对应的至少一个纠错词;针对各错误词,分别确定错误词与其前、后词在预设语料库中的第一共现频次、第二共现频次;针对错误词对应的各纠错词,获取语义特征;至少根据第一共现频次、第二共现频次及语义特征,判定纠错词是否正确。判定纠错词的正确性,可提升文本校对准确率。对纠错词的正确性进行判定时,综合考虑了前后词的搭配及上下文语义特征,可保证纠错词的正确性判定的精度,从而进一步提升文本校对准确率。此外,使得校对工作智能化、自动化,减轻人工校对的压力,提升工作效率,降低人工成本。

Patent Agency Ranking