一种文本相似度计算方法、装置及服务器

    公开(公告)号:CN108052509A

    公开(公告)日:2018-05-18

    申请号:CN201810095301.5

    申请日:2018-01-31

    发明人: 任宁 李德彦

    IPC分类号: G06F17/27

    CPC分类号: G06F17/2795 G06F17/2775

    摘要: 本申请实施例提供了一种文本相似度计算方法、装置及服务器。在计算文本相似度时,考虑到文本内容对相似度的影响,获取两个文本词义相同的共有成分;考虑到语序对相似度的影响,获取共有成分在每个文本中的前接成分,并根据每个共有成分在每个文本中出现的次数T1和T2,以及每个共有成分在两个文本中相同前接成分的数量C1和相同后接成分的数量C2;然后,综合文本内容对相似度的影响和语序对相似度的影响,根据T1和T2、以及C1和C2得到每个共有成分对文本相似度的贡献度;最后,根据对共有成分预设的权重和相似度,计算文本相似度。从而,解决了现有技术中由于无法处理文本语序,导致计算中文文本相似度的准确度不理想的问题。

    文本相似度计算方法及装置

    公开(公告)号:CN107977676A

    公开(公告)日:2018-05-01

    申请号:CN201711194408.7

    申请日:2017-11-24

    IPC分类号: G06K9/62 G06F17/27 G06F17/30

    摘要: 本发明实施例提供了一种文本相似度计算方法及装置,本发明实施例利用第一词向量训练模型对两个文本中词汇进行训练,得到每个词汇对应的词向量,之后计算两个词向量的余弦相似度,最后利用词向量的最大余弦相似度计算两个文本的相似度,由于词向量包含对应词汇的上下文信息,因此词向量的余弦相似度能够反映对应的词汇的意义相似程度,那么利用余弦相似度计算得到的两个文本的相似度就能够准确反映两个文本的意义相似程度,即利用余弦相似度能够提高文本相似度计算的准确性,从而客服了现有技术中只能利用相同的词汇来确定两个文本的相似度所带来的局限性。

    一种网络访问控制方法和系统

    公开(公告)号:CN104580078B

    公开(公告)日:2018-04-17

    申请号:CN201310481662.0

    申请日:2013-10-15

    IPC分类号: H04L29/06 H04L12/24

    摘要: 本发明公开了一种网络访问控制方法和系统,涉及计算机网络信息安全技术领域。通过算法针对不同防火墙品牌、型号自动计算生成可执行的防火墙命令脚本,将该可执行的防火墙命令脚本下发到目标防火墙设备,并自动对防火墙进行新策略的设置,最后根据设置后的新的防火墙策略对网络访问进行安全控制,从而实现高效准确的防火墙策略自动配置方案,且能够实现灵活的防火墙策略定制功能,为网络访问控制提供更大的安全保证和灵活应用的基础。

    时间词的抽取方法及装置

    公开(公告)号:CN107894978A

    公开(公告)日:2018-04-10

    申请号:CN201711123985.7

    申请日:2017-11-14

    发明人: 任宁 张建军

    IPC分类号: G06F17/27

    摘要: 本发明实施例公开一种时间词的抽取方法及装置,该方法包括以下步骤:获取待抽取时间词的文本;抽取所述文本中全部的候选词,每一个所述候选词至少具有一种语义用于表征时间;确定各个候选词在所述文本中分别对应的语义区域,所述语义区域包括候选词及候选词前后的预定数量个字符;如果所述语义区域中不包含与候选词相对应的第一预设字符串,则确定所述候选词为时间词,并输出所述时间词。上述技术方案一方面可以简化抽取规则,扩大抽取出的候选词的数量,避免因为抽取规则过于复杂而导致大量时间词被遗漏的情况;另一方面,通过对候选词进行消歧,能够较为准确地抽取出文本中的时间词,尤其适用于时间词表现形式多样化的中文文本。

    一种UDP负载均衡方法、装置和系统

    公开(公告)号:CN107888643A

    公开(公告)日:2018-04-06

    申请号:CN201610876004.5

    申请日:2016-09-30

    IPC分类号: H04L29/08 H04L29/06

    摘要: 本发明公开了一种UDP负载均衡方法、装置和系统,该方法包括:接收客户端的请求,判断所述请求是否为用户数据报协议UDP请求;当确定所述请求为UDP请求时,读取Nginx服务器预先配置的记录有后台服务器的信息和UDP标识的后台服务器列表,并按照预设的分发策略将所述UDP请求分发至所述后台服务器。本发明提供的基于Nginx的负载均衡方案,能够满足高并发和高UDP请求场景的需求,也可横向扩展,方便提升性能,并且,与硬件解决方案相比,成本低廉。

    一种业务文档公式提取方法及装置

    公开(公告)号:CN107885870A

    公开(公告)日:2018-04-06

    申请号:CN201711189981.9

    申请日:2017-11-24

    发明人: 任宁 郝思洋 张青

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本申请提供一种业务文档公式提取方法及装置,在对业务文本中的公式内容进行提取过程中,先定位业务文档中的特征语句,以减少数据处理量;再定位特征语句中的特征词信息,并确定特征语句中包含结果量信息的结果量语句以及包含自变量和运算关系信息的自变量语句;再根据信息抽取模型提取语句中的结果量信息、自变量信息以及运算关系信息,最后将提取的结果量信息和自变量信息按照运算关系组合成公式进行保存。本申请提供的公式提取方法,可根据信息抽取模型分析业务文档中的公式,并提取出相应的公式信息,提高数据挖掘的效率,解决现有公式提取方法不能识别隐含在文本中的公式内容的问题。

    一种语义受控的答案生成方法、装置及系统

    公开(公告)号:CN107329995B

    公开(公告)日:2018-03-23

    申请号:CN201710426349.5

    申请日:2017-06-08

    IPC分类号: G06F17/30 G06F17/27

    摘要: 本发明实施例公开了一种语义受控的答案生成方法、装置及系统,对于用户提出的问题,首先,获取问题的候选答案,提取问题中的结构化信息,所述结构化信息至少包括语义限制信息;其次,对问题的候选答案进行句法分析;然后,根据句法分析结果,利用语义限制信息对候选答案进行语义限制处理,得到语义受控的候选答案,最后,从语义受控的候选答案中选择出一个候选答案作为问题答案。实现了对现有技术的Seq2Seq模型生成的答案进行语义控制,解决了Seq2Seq模型生成的答案与问题无语义关联的问题。

    一种基于iOS平台的应用集成方法和装置

    公开(公告)号:CN107770208A

    公开(公告)日:2018-03-06

    申请号:CN201610676182.3

    申请日:2016-08-16

    IPC分类号: H04L29/08 G06F9/445 H04L29/06

    摘要: 本发明公开了一种基于iOS平台的应用集成方法和装置,该方法包括:响应于用户触发启动应用集成功能的操作,从服务器获取所集成的各应用的参数信息并保存;根据各应用的参数信息,向用户集中展示所集成的各应用的应用标识;响应于用户触发所展示的一个应用的应用标识的操作,根据该应用的参数信息获得该应用的集成类型,根据该应用的集成类型跳转到该应用对应的界面,以供用户在该应用对应的界面中触发执行相应的功能。本方案对多种不同的应用进行集成,因集成方式不同而具有不同的集成类型,在启动时从服务器获取所集成的各应用的参数信息,根据该参数信息对各应用进行展示和跳转,扩展了在iOS平台上进行应用集成的思路与方式,有利于企业级应用的定制和发展。

    无线网络频率分配方法和系统

    公开(公告)号:CN104754584B

    公开(公告)日:2018-02-27

    申请号:CN201310744702.6

    申请日:2013-12-30

    发明人: 黄剑锋

    IPC分类号: H04W16/02 H04W24/00

    摘要: 本发明实施例公开了一种无线网络频率分配方法和系统,涉及移动通信技术领域。本发明实施例提供一种无线网络频率分配方法和系统,利用受扰话务面积占比计算得到无线网络中正常质量等级(质量等级为1至5级)的信号占比,能够精确反映无线网络的受干扰情况,进而根据不同频率方案对应的正常质量等级信号占比,实现对无线网络的频率分配方案。本发明实施例能够适用于不同的无线网络结构,频率分配精确,并且算法简单,效率高;为无线网络频率分配提供了一种科学准确的测量和分析手段。

    一种自定义规则的文本信息抽取结果筛选方法及装置

    公开(公告)号:CN107729481A

    公开(公告)日:2018-02-23

    申请号:CN201710961777.8

    申请日:2017-10-16

    IPC分类号: G06F17/30

    CPC分类号: G06F16/322 G06F16/3331

    摘要: 本申请公开一种自定义规则的文本信息抽取结果筛选方法及装置,该方法包括获取待抽取文本信息和预设的模型树,模型树包括至少若干个节点和每个节点对应的抽取表达式集;响应于用户选择所述节点的操作,利用模型树中所选节点对应的抽取表达式集对待抽取文本信息进行信息抽取,得到抽取结果;获取模型树对应的预设节点路径;利用所述预设节点路径的终止节点,按照预设的筛选规则,对抽取结果进行筛选,得到筛选结果,预设的筛选规则包括全节点筛选规则、子节点筛选规则和当前节点筛选规则。本申请利用预设节点路径的终止节点,按照用户所选择的筛选规则,对抽取结果再次进行提取,最终得到用户所需的抽取结果,得到精确地抽取结果,提高抽取效率。