一种基于自然语言处理的多语言分析方法和装置

    公开(公告)号:CN108197109A

    公开(公告)日:2018-06-22

    申请号:CN201711488119.8

    申请日:2017-12-29

    Abstract: 一种基于自然语言处理的多语言分析方法和装置,包括:通过语种检测训练模型选择输入自然语句文本信息语言种类;通过训练得到的词向量模型,得到计算机可识别的对应词语的词嵌入表达信息,并对得到的词嵌入表达信息通过TF-IDF方式提取得到关键词;根据关键词和关键词权重计算得到文章向量和每个预设类目的类目向量,计算自然语句文本信息的文章与每个预设类目的相似度来确定所述自然语句文本信息的文本分类结果;将自然语句文本信息的词嵌入表达信息,输入训练后的卷积神经网络和双向门循环单元的并行架构的文本情感分析模型,并通过计算得到最终的情感倾向值。本发明解决了传统多语言分析方法需要了解相关语言学的领域知识且需要大量人工操作的问题。

    一种文本分类方法、装置及电子设备

    公开(公告)号:CN107766426B

    公开(公告)日:2020-05-22

    申请号:CN201710828217.5

    申请日:2017-09-14

    Abstract: 本申请公开了一种文本分类方法、装置及电子设备,所述方法包括:通过无监督方法训练词向量模型;根据词向量模型,确定在文本中提取出的关键词的词向量;根据所述关键词的词向量,确定所述文本的文本向量;计算所述文本向量与预设类目的向量之间的相似度;将相似度符合预设条件的类目作为所述文本的类目。本发明实现了对文本的无监督方式分类,避免大工作量的人工标注数据,降低成本。

    账号资源管理装置、方法及数据采集系统、方法

    公开(公告)号:CN111083136A

    公开(公告)日:2020-04-28

    申请号:CN201911275230.8

    申请日:2019-12-12

    Abstract: 本公开涉及一种账号资源管理装置、方法及数据采集系统、方法。本公开提供的技术方案,对于每个账号使用不同的固定登录IP、登录Header信息进行模拟登录,在登录后将获得的Cookie信息与所述登录IP和登录Header信息关联存储,以模拟一个用户在一个地方使用固定浏览器上网,避免出现一个账号、cookie对应多个IP及单个IP被大量用户使用的情况,从而避免受到浏览拦截限制。并且,每一账号登录模块与一下载解析服务节点对应且与一组登录IP对应,从而可以通过控制每个下载解析服务节点对应的登录IP分配,以实现控制多个下载解析服务节点的负载均衡。

    数据反馈方法与装置
    27.
    发明公开

    公开(公告)号:CN110866085A

    公开(公告)日:2020-03-06

    申请号:CN201911064999.5

    申请日:2019-11-04

    Abstract: 本申请公开了提供了一种数据反馈方法与装置,涉及数据查询技术领域。通过将数据查询信息输入至多模式匹配自动机,以从多个表格中的第一目标关键词中,提取出与数据查询信息匹配的第二目标关键词,其中,多模式匹配自动机根据多个表格中的第一目标关键词预先构建而成;如果根据预先建立的倒排索引匹配出包括第二目标关键词的表格时,记录每个表格包括第二目标关键词的数量,其中,倒排索引预先根据多个表格的第一目标关键词及表格ID构建而成;将数量排序为前N的表格反馈至终端设备,从而无需人工逐个遍历工作表,大大提高了数据问答的效率,并且精确度也高。

    一种数据查询的方法、装置及电子设备

    公开(公告)号:CN110674112A

    公开(公告)日:2020-01-10

    申请号:CN201910899832.4

    申请日:2019-09-23

    Abstract: 本发明实施例公开了一种数据查询的方法、装置及电子设备,所述方法、装置及电子设备包括:获取待查询语句中包含的目标实体信息;基于目标实体信息,从预设数据库中获取与目标实体信息匹配的目标关联信息,预设数据库包括第一数据库和第二数据库,第一数据库用于存储实体信息,第二数据库用于存储与实体信息匹配的关联信息,其中,关联信息包括实体执行和/或响应的关联事件以及所述关联事件的响应或执行对象。采用该方法、装置及电子设备,在查询目标实体的多个关联信息时,不需要多次查询,可以基于待查询语句中的目标实体信息,从预设数据库中获取与目标实体信息匹配的多个目标关联信息,从而提高关联信息的查询效率。

    消息同步方法、装置、可读存储介质、电子设备及系统

    公开(公告)号:CN110661697A

    公开(公告)日:2020-01-07

    申请号:CN201910853990.6

    申请日:2019-09-10

    Abstract: 本公开涉及一种消息同步方法、装置、可读存储介质、电子设备及系统。该方法包括:获取消息发送终端发送的目标消息,根据账号和服务标识之间的对应关系,确定接收账号对应的目标服务,将目标消息存储在目标服务对应的同步队列中,以使目标服务从目标服务对应的同步队列中提取目标消息,并将目标消息内容推送至与目标服务对应的消息接收终端。如此,即便账号在不同的终端上随时随地登录时,也可以保证消息不丢失,并且无需提前配置分发规则,就可以实现对消息的多端同步。此外,由于消息推送均是在服务器中进行的,消息发送终端和消息接收终端只需要发送、接收目标消息即可,降低了终端的逻辑处理量。

    一种数据采集方法和设备
    30.
    发明授权

    公开(公告)号:CN106383764B

    公开(公告)日:2019-01-18

    申请号:CN201610800160.3

    申请日:2016-08-31

    Abstract: 本发明公开了一种数据采集方法和设备,包括接收用户发送的数据采集信息,所述数据采集信息中包含待采集的数据类型和用于采集所述数据类型对应的系统资源数据的插件标识;根据预设的数据类型与用于采集所述数据类型对应的系统资源数据的插件标识之间的映射关系,匹配与所述数据采集信息中包含的所述待采集的数据类型对应的插件标识;调用所述插件标识对应的插件采集所述数据类型对应的系统资源数据;并将采集到的所述系统资源数据发送至数据库。这样,通过根据用户发送的数据采集信息调用对应插件,实现对服务器系统资源数据的采集,使用户能够方便地从数据库中获取到满足需求的系统资源数据,增加了数据获取的灵活性,提升了用户的使用体验。

Patent Agency Ranking