Web业务行为的识别方法及装置

    公开(公告)号:CN107403013A

    公开(公告)日:2017-11-28

    申请号:CN201710647783.6

    申请日:2017-08-01

    IPC分类号: G06F17/30 G06F11/34

    摘要: 本发明提供了一种Web业务行为的识别方法及装置,涉及网络信息安全的技术领域,该方法包括:获取Web业务的统一资源定位符;对统一资源定位符进行解析,得到目录单词和页面信息,其中,页面信息包括以下至少之一:页面名称,请求参数,页面元素;将目录单词与目录单词字典库进行匹配,以将目录单词翻译成业务目录,并将页面信息与页面单词字典库进行匹配,以将页面信息翻译成业务单词;基于业务目录和业务单词识别Web业务的业务行为,缓解了现有技术中存在的Web业务行为识别准确率较低的技术问题。

    新词发现方法及装置
    3.
    发明公开

    公开(公告)号:CN105224682A

    公开(公告)日:2016-01-06

    申请号:CN201510706240.8

    申请日:2015-10-27

    发明人: 张昊 朱频频

    IPC分类号: G06F17/30

    摘要: 一种新词发现方法及装置,所述方法包括:对接收到的语料进行预处理,以得到文本数据;对所述文本数据进行分行处理,得到语句数据;依照基础词典中包含的单独词对所述语句数据进行分词处理,以得到分词后的词语数据;对相邻的所述分词后的词语数据进行组合处理,以生成候选数据串;判断所述候选数据串是否为特定候选数据串,所述特定候选数据串包括基础名词,且位于所述基础名词的特定相对位置的词语为名词或形容词;对所述候选数据串进行判断处理,以发现新词。所述方法及装置可以提升新词发现的准确率。

    类别专名挖掘方法及装置

    公开(公告)号:CN104331456A

    公开(公告)日:2015-02-04

    申请号:CN201410601567.4

    申请日:2014-10-31

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30666

    摘要: 本发明实施例公开了一种类别专名挖掘方法及装置。所述方法包括:首先,将预设的目标类别下的至少一个种子词,与查询句/词集合中的查询句/词进行匹配,得到与至少一个种子词对应的至少一个目标类别模板,其中查询句/词集合为用户在搜索引擎中输入的历史查询句/词组成的集合;然后,再将至少一个目标类别模板,与查询句/词集合中的查询句/词进行匹配,得到目标类别下与至少一个目标类别模板对应的至少一个候选专名。本实施例提供的技术方案,能够提高挖掘准确率,便于后续能够很好的理解用户在搜索产品中输入的查询句/词。

    一种智能应答方法及其系统

    公开(公告)号:CN107943972A

    公开(公告)日:2018-04-20

    申请号:CN201711217981.5

    申请日:2017-11-28

    发明人: 施文进 施俊

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种智能应答方法及其系统,包括:建立物流问题字典,为所述物流问题设置答案并记录在物流问题字典中;将用户提出的未知物流问题与所述录入物流问题字典中处理后的物流问题进行模糊匹配;物流问题字典得到不断学习和完善并建立多语种的所述物流问题字典以及为所述物流问题设置对应答案;根据用户选择的目标语种给用户语音输出所述答案,实现智能应答。本发明针对物流行业用户经常提问的问题,采用语义分析技术处理这类问题并有针对性地为用户设置问题答案,形成物流问题答案字典,改善了现有技术中软件在自动应答时准确率较低,无法满足用户多种提问方式、用户体验较差以及用户可选择语言单一等问题。

    一种敏感词检测方法、装置、设备及介质

    公开(公告)号:CN107807994A

    公开(公告)日:2018-03-16

    申请号:CN201711090177.5

    申请日:2017-11-08

    发明人: 刘霄

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30622 G06F17/30666

    摘要: 本发明实施例公开了一种敏感词检测方法、装置、设备及介质。该方法包括:将至少一个标准敏感词进行切词,获取所述标准敏感词对应的起始字;对所述起始字进行去重复操作,得到标准字;根据所述标准字,对所述标准敏感词构建倒排索引;根据所述倒排索引,确定待检测语句中是否存在敏感词。本发明实施例简练了倒排索引,减少了存储空间,提升了敏感词检测的准确率和效率。

    一种文本信息处理方法及装置

    公开(公告)号:CN107229638A

    公开(公告)日:2017-10-03

    申请号:CN201610173702.9

    申请日:2016-03-24

    发明人: 韩秦

    IPC分类号: G06F17/30

    摘要: 本发明实施例提供一种文本信息处理方法和装置,所述方法包括:获取文本信息;对所述文本信息进行规则提取,生成文本信息识别模板;所述文本信息识别模板用于进行文本信息匹配。本发明实施例可以标识文本信息的可信度,特别可以应用于准确识别垃圾短信、诈骗短信等文本信息,有效拦截此类信息,有效保护用户信息、财产安全。

    一种信息处理的方法及装置

    公开(公告)号:CN107193922A

    公开(公告)日:2017-09-22

    申请号:CN201710342555.8

    申请日:2017-05-16

    发明人: 杨广煜

    IPC分类号: G06F17/30

    摘要: 本发明实施例提供了一种信息处理的方法,涉及信息处理领域,在一定程度上减少用户操作。该方法包括:采集当前播放内容;根据采集到的播放内容,确定待搜索信息;根据所述待搜索信息进行搜索,得到与所述待搜索信息对应的搜索结果;将所述搜索结果的相关信息按照指定方式进行显示。本发明实施例适用于信息搜索过程中。

    基于术语释义知识单元的专业领域知识图谱动态构建方法

    公开(公告)号:CN106919689A

    公开(公告)日:2017-07-04

    申请号:CN201710123066.3

    申请日:2017-03-03

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种基于术语释义知识单元的专业领域知识图谱动态构建方法,涉及计算机信息管理与信息处理领域。该方法采用自然语言处理技术从真实文本中自动抽取和更新知识单元,能够以更细的颗粒度内容反映专业知识的真实内容,实现动态的更新和管理,解决传统上单纯依靠人工判定造成的时效性不足、主观性过大、更新维护困难等难题,为专业领域的大规模知识库建设提供更好的技术手段;另外,采用网状的拓扑结构,使知识单元之间的关联性更为紧密,语义维度多元化,并以可视化的知识地图方式进行了直观的展示,为进行知识的自动发现、推理和计算提供了良好的知识基础,能够有效支撑工程应用。

    中文自然语言问句语义化的知识库自动问答方法

    公开(公告)号:CN105701253A

    公开(公告)日:2016-06-22

    申请号:CN201610125710.6

    申请日:2016-03-04

    申请人: 南京大学

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种中文自然语言问句语义化的知识库自动问答方法,包括以下步骤:对用户输入的事实型问题进行中文自然语言处理,实现分词、词性标注、命名实体识别和扩展,生成语义依存树;使用泛化模板和语义解析技术获得问句中的时间、空间、事实主体、事实客体等组成成分,然后进行语义化处理,提取问句中所有事件相关的组成元素属性及其取值,生成多个“属性—取值”对,其中待回答的元素以疑问词代替,形成复杂事实三元组集合;待回答部分所在三元组联合其他相关事实三元组形成一个带条件约束的知识库查询,到知识库中进行基于相似度计算的查询匹配,从知识库中抽取结果,得到最终答案。本发明实现了对知识库的快速准确的查询应答。