文本的知识结构化处理方法、装置、设备和可读存储介质

    公开(公告)号:CN112241458A

    公开(公告)日:2021-01-19

    申请号:CN202011089921.1

    申请日:2020-10-13

    Abstract: 本申请实施例提供了一种文本的知识结构化处理方法、装置、设备和可读存储介质,其中,方法包括:对待处理文本根据业务特征进行分类处理,得到所述待处理文本的业务类型;根据所述待处理文本的业务类型,对所述待处理文本进行实体提取处理,得到所述待处理文本的实体要素;基于所述实体要素在有向连接实体关系图中的入度值和在所述待处理文本中的相对距离值,对所述待处理文本进行关系抽取处理,确定所述待处理文本的实体关系对,得到所述待处理文本的知识结构化信息。本申请实施例不需要大量的数据标注和较高的硬件资源,可以有效提升关系抽取的准确性,节约人工和成本,满足实际业务的需求。

    文本校对方法、装置、计算机可读存储介质及电子设备

    公开(公告)号:CN110929514A

    公开(公告)日:2020-03-27

    申请号:CN201911144534.0

    申请日:2019-11-20

    Abstract: 本公开涉及一种文本校对方法、装置、计算机可读存储介质及电子设备。方法包括:确定待校对文本中各句子的纠错信息,纠错信息包括错误词和其对应的至少一个纠错词;针对各错误词,分别确定错误词与其前、后词在预设语料库中的第一共现频次、第二共现频次;针对错误词对应的各纠错词,获取语义特征;至少根据第一共现频次、第二共现频次及语义特征,判定纠错词是否正确。判定纠错词的正确性,可提升文本校对准确率。对纠错词的正确性进行判定时,综合考虑了前后词的搭配及上下文语义特征,可保证纠错词的正确性判定的精度,从而进一步提升文本校对准确率。此外,使得校对工作智能化、自动化,减轻人工校对的压力,提升工作效率,降低人工成本。

    语句等价性判断方法和装置

    公开(公告)号:CN110633359A

    公开(公告)日:2019-12-31

    申请号:CN201910832807.4

    申请日:2019-09-04

    Abstract: 本申请实施例公开了一种语句等价性判断方法和装置,所述方法包括:获取待判断等价性的语句;将所述语句输入预先训练的等价性判断模型,所述等价性判断模型根据基于深度学习模型和人工特征模型的模型平均方法训练得到;通过所述等价性判断模型对所述语句进行等价性判断,得到等价性判断结果。通过本申请实施例,可以提高语句等价性判断的效率和精确性。

    一种基于规则的实时决策系统及方法

    公开(公告)号:CN109447485A

    公开(公告)日:2019-03-08

    申请号:CN201811294029.X

    申请日:2018-10-31

    Abstract: 本发明公开了一种基于规则的实时决策系统及方法,系统主要包括Kafka平台、kudu数据库、hive数据库、原始数据输入模块、数据解析过滤模块、决策树配置模块、Zookeeper、决策树解析器、决策森林模块、连接池。通过本发明可以实时收集、监控用户的行为日志数据,根据营销场景需求,构建自动化营销场景规则树,连接用户线上和线下的行为,实时判断用户的标签、特征、行为,然后通过短信、邮件、APP推送消息等不同渠道实现对用户的精准触达,与用户的互动沟通,达到树立品牌形象或提升转化率的效果,实现精准营销的营销行为。

    一种文本分类方法、装置及电子设备

    公开(公告)号:CN107766426A

    公开(公告)日:2018-03-06

    申请号:CN201710828217.5

    申请日:2017-09-14

    Abstract: 本申请公开了一种文本分类方法、装置及电子设备,所述方法包括:通过无监督方法训练词向量模型;根据词向量模型,确定在文本中提取出的关键词的词向量;根据所述关键词的词向量,确定所述文本的文本向量;计算所述文本向量与预设类目的向量之间的相似度;将相似度符合预设条件的类目作为所述文本的类目。本发明实现了对文本的无监督方式分类,避免大工作量的人工标注数据,降低成本。

    跨屏用户标识归一的方法及其系统

    公开(公告)号:CN106528777A

    公开(公告)日:2017-03-22

    申请号:CN201610977040.0

    申请日:2016-10-27

    CPC classification number: G06F16/285 G06F16/2465

    Abstract: 本发明公开一种跨屏用户标识归一的方法及其系统,其中该方法包括:针对多个终端设备,分别根据每个终端设备的标识信息从预先建立的数据库中获取每个终端设备对应的行为属性信息;根据终端设备的行为属性信息确定多个候选集合,其中每个候选集中包括相关联的多个终端设备;提取所述多个候选集合的特征参数作为训练数据并构建分类模型;根据所述分类模型确定待预测数据的分类信息,并将同一分类的终端设备生成统一的标识信息。通过本发明能够有效确定相关联的终端设备。

    数据处理方法及装置
    27.
    发明公开

    公开(公告)号:CN106202503A

    公开(公告)日:2016-12-07

    申请号:CN201610574191.1

    申请日:2016-07-19

    CPC classification number: G06F16/958 G06F16/9535

    Abstract: 本发明实施例提供一种数据处理方法及装置,涉及计算机技术领域。其中,所述方法包括:当监听到有新的网络数据时,将所述新的网络数据存储至数据源;采用流式计算框架storm将所述数据源中的网络数据进行拓扑处理,得到数据拓扑;将所述数据拓扑中的各网络数据发射至storm中对应的数据操作节点bolt中进行处理,得到处理结果;将所述处理结果存入存储介质中。本发明实施例提供的技术方案实现了数据处理的实时性。

    一种基于规则的实时决策系统及方法

    公开(公告)号:CN109447485B

    公开(公告)日:2020-09-04

    申请号:CN201811294029.X

    申请日:2018-10-31

    Abstract: 本发明公开了一种基于规则的实时决策系统及方法,系统主要包括Kafka平台、kudu数据库、hive数据库、原始数据输入模块、数据解析过滤模块、决策树配置模块、Zookeeper、决策树解析器、决策森林模块、连接池。通过本发明可以实时收集、监控用户的行为日志数据,根据营销场景需求,构建自动化营销场景规则树,连接用户线上和线下的行为,实时判断用户的标签、特征、行为,然后通过短信、邮件、APP推送消息等不同渠道实现对用户的精准触达,与用户的互动沟通,达到树立品牌形象或提升转化率的效果,实现精准营销的营销行为。

Patent Agency Ranking