一种口语化短文本的实体属性提取方法及电子装置

    公开(公告)号:CN113761919A

    公开(公告)日:2021-12-07

    申请号:CN202010500426.9

    申请日:2020-06-04

    IPC分类号: G06F40/295 G06F40/211

    摘要: 本发明提供一种口语化短文本的实体属性提取方法及电子装置,包括对口语化短文本切词及词性标注,并对各标注词性的词语进行命名主体识别,得到实体词语;将口语化短文本映射为主谓宾三元组,获取主谓宾三元组中各词语的依存关系,并使用实体词语对主谓宾三元组中各词语进行实体识别;当主谓宾三元组中的主谓宾满足一触发规则时,提取宾语词组作为实体属性。本发明采用词性标注、依存句法分析、实体识别以及结合触发词词性规则的综合方法,更加有针对性的提取了口语化短数据的实体属性信息,丰富了口语化短文本领域的结构化信息抽取方法。

    规则查询方法、装置、计算机设备和存储介质

    公开(公告)号:CN112383479B

    公开(公告)日:2022-03-22

    申请号:CN202011104222.X

    申请日:2020-10-15

    IPC分类号: H04L45/745

    摘要: 本申请涉及一种规则查询方法、装置、计算机设备和存储介质。该方法包括:计算机设备通过获取请求报文的五元组信息中的互联网协议IP地址,从预设的多个五元组规则表中,确定与该IP地址对应的目标五元组规则表,根据五元组信息查询目标五元组规则表,确定与五元组信息对应的目标五元组规则。本方法中,五元组规则表中包括五元组信息和五元组规则的对应关系,计算机设备在根据请求报文的五元组信息中的IP确定与其对应的目标五元组规则表之后,根据目标五元组规则表进行目标五元组规则的查询,避免了遍历所有五元组规则表的情况,减少了五元组规则的查询次数,节省了五元组规则的查询资源,进一步地,降低了FPGA的输入输出单元的消耗情况。

    规则查询方法、装置、计算机设备和存储介质

    公开(公告)号:CN112383479A

    公开(公告)日:2021-02-19

    申请号:CN202011104222.X

    申请日:2020-10-15

    IPC分类号: H04L12/741

    摘要: 本申请涉及一种规则查询方法、装置、计算机设备和存储介质。该方法包括:计算机设备通过获取请求报文的五元组信息中的互联网协议IP地址,从预设的多个五元组规则表中,确定与该IP地址对应的目标五元组规则表,根据五元组信息查询目标五元组规则表,确定与五元组信息对应的目标五元组规则。本方法中,五元组规则表中包括五元组信息和五元组规则的对应关系,计算机设备在根据请求报文的五元组信息中的IP确定与其对应的目标五元组规则表之后,根据目标五元组规则表进行目标五元组规则的查询,避免了遍历所有五元组规则表的情况,减少了五元组规则的查询次数,节省了五元组规则的查询资源,进一步地,降低了FPGA的输入输出单元的消耗情况。

    一种大数据流中的基于最近邻的时间敏感性异常检测方法

    公开(公告)号:CN109871870B

    公开(公告)日:2021-05-25

    申请号:CN201910035916.3

    申请日:2019-01-15

    IPC分类号: G06K9/62

    摘要: 本发明提供一种大数据流中的基于最近邻的时间敏感性异常检测方法,属于大数据流、异常检测技术领域,核心是一个以LSH抽样视图为基础的统计估计器,滑动窗口使用确定波模型,将估计确定波窗口内多个随机时间区间的计数和方差以监测数据在不同时间区间的分布,能够快速寻找大数据流中的各数据的邻居,降低计算开销,无需单独为每个数据保存其邻居信息,节省空间占用,提高更新效率,基于时间敏感性能够快速判断数据分布是否异常以及异常发生的时间范围。