文本数据查询方法及装置

    公开(公告)号:CN108427686A

    公开(公告)日:2018-08-21

    申请号:CN201710081024.8

    申请日:2017-02-15

    发明人: 黄杰

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种文本数据查询方法及装置,获取待查询文本,从待查询文本中提取多个关键词,构建每个关键词对应的关键词序列,该关键词序列中至少包括关键词以及关键词的至少一个近义词,基于满足预设条件的关键词序列在预设查询数据库中进行文本数据查询,实现了文本数据的自动查询,而不需要用户输入关键词,从而提高文本数据的搜索速度。也就是说,基于本发明提供的文本数据查询方法及装置,用户只要将待查询文本输入搜索系统即可查询到与待查询文本近似的文本数据,不再需要用户确定并输入关键词,在简化用户操作的同时提高文本数据的搜索速度。

    语义查询语言
    2.
    发明授权

    公开(公告)号:CN104584013B

    公开(公告)日:2018-06-26

    申请号:CN201380045160.1

    申请日:2013-08-21

    IPC分类号: G06F17/30

    摘要: 本文中描述的各技术涉及执行混合查询以搜索保存在数据储存库中的数据库。混合查询包括正规表达式(该正规表达式是元素的模式)以及语义约束。正规表达式中的元素包括第一通配符,其中语义约束限制该第一通配符的含义。另外,正规表达式中的元素包括显式词汇约束和/或全异通配符。例如,语义约束可限制全异通配符的含义。混合查询被执行以检索与正规表达式中的元素的模式相匹配并且满足语义约束的结果。

    一种电子书管理方法及装置

    公开(公告)号:CN107741981A

    公开(公告)日:2018-02-27

    申请号:CN201710970175.9

    申请日:2017-10-16

    申请人: 桂进林

    发明人: 桂进林

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30657 G06F17/30613

    摘要: 本发明提供一种电子书管理方法及装置,该方法包括:接收用户终端发送的电子书存储请求,电子书存储请求携带用户标识和电子书信息;确定是否已存储电子书信息对应的电子书,如果否,则获取并存储电子书;确定存储电子书后,对用户标识和电子书信息对应的电子书进行双向绑定。本发明为用户创建个人书库,能实现将用户终端本地存储的用户自有的电子书上传到服务器中,通过个人书库对用户自有电子书的添加、删除、阅读进度及笔记等进行管理。且将自有的电子书上传服务器之后,尽管用户使用不同的用户终端,只要用户登录个人书库就可以管理这些电子书,在不同的用户终端之间实现这些电子书的共享,便于用户对自有电子书的管理及阅读。

    一种问句推荐方法及系统

    公开(公告)号:CN107704563A

    公开(公告)日:2018-02-16

    申请号:CN201710908123.9

    申请日:2017-09-29

    发明人: 徐波

    IPC分类号: G06F17/30

    摘要: 本发明提供一种问句推荐方法,包括以下步骤:S1:接收语料数据,所述语料数据为多回合的问答数据;S2:将语料数据转化生成正例对,通过随机采样与所述语料数据结合生成反例对;S3:通过word2vec模型对正例对和反例对进行词向量化,分别获取句子向量矩阵;S4:将句子向量矩阵输入到隐含层,句子向量矩阵和权重矩阵进行点积运算,得到新的句子向量矩阵;S5:将句子向量矩阵输入至卷积神经网络中,进行卷积和池化采样操作,得到句子的语义向量;S6:对句子的语义向量进行非线性变换,求取正例化句子对的语义向量的余弦相似度和反例化句子对的余弦相似度,最后获取预测模型。本发明还提供了一种用于实现上述方法的问句推荐系统。

    基于文法网络和lucene的语义分析方法

    公开(公告)号:CN107704451A

    公开(公告)日:2018-02-16

    申请号:CN201710972496.2

    申请日:2017-10-18

    发明人: 周红 刘楚雄

    IPC分类号: G06F17/27 G06F17/30

    摘要: 本发明公开了一种基于文法网络和lucene的语义分析方法,a)编写文法网络语法规则;b)Lucene索引文件构建;c)解析器中增加lucene搜索叶子节点rule列表;d)语句匹配,按照定义的规则,匹配指定的叶子节点。发明将文法网络和lucene结合,在语义分析方面降低了工作量和重复性,使用lucene检索,提高了检索速度,能够很好的索引变量,能快速高效的解析语义。

    一种基于余弦距离的前沿科技信息快速推送方法及系统

    公开(公告)号:CN107657067A

    公开(公告)日:2018-02-02

    申请号:CN201711125200.X

    申请日:2017-11-14

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30867 G06F17/30657

    摘要: 本发明公开了一种基于余弦距离的前沿科技信息快速推送方法及系统,方法包括构造余弦距离索引和推送信息两个过程,它首先爬取科技信息文章并存储到科技信息数据库中,并对爬取科技信息文章建立索引;然后通过快速对比新增文章和数据库的原有文章来查询是否有相同或者近似的文章,判断该新增文章内容是否已经被推送过,如果没有被推送过则加以选择并进行推送给用户。系统包括余弦距离索引模块、科技信息数据库和推送信息模块。本发明不仅使推送给用户的前沿科技信息避免相似性冗余,而且采用余弦距离索引可以加快文章的相似性判断,及时地将前沿信息推送给用户。

    一种基于证据链时间序列的关键证据二分搜索方法

    公开(公告)号:CN107463714A

    公开(公告)日:2017-12-12

    申请号:CN201710736597.X

    申请日:2017-08-24

    IPC分类号: G06F17/30

    CPC分类号: G06F17/30657

    摘要: 本发明公开了一种基于证据链时间序列的关键证据二分搜索方法,包括:根据时间戳将原始数据排序得到证据链时间序列;将所需查找的关键时间戳或时间段的起始时间戳、终止时间戳作为键值;应用二分查找,在证据链时间序列的结点中查找与键值相等的结点时间戳;根据查找结果,在证据链时间序列的关键时间点或时间段中进行取证调查。本发明在面对较大数据量的数字取证分析中能够有效减少搜索关键证据所耗费的时间,提高取证效率,与现有取证工具所提供的匹配搜索方法相比,具有较好的时间性能。

    一种全文搜索的方法及系统

    公开(公告)号:CN107423349A

    公开(公告)日:2017-12-01

    申请号:CN201710352515.1

    申请日:2017-05-18

    发明人: 沈文策

    IPC分类号: G06F17/30

    摘要: 本发明公开了一种全文搜索的方法及系统,该方法包括:接收用户输入的搜索请求,对搜索请求进行分词处理,生成至少一个分词;根据分词生成搜索索引;根据搜索索引在预设索引库中进行匹配得出搜索结果。本发明实施例通过将可搜索文档的内容通过分词处理生成搜索索引在预设索引库中进行搜索,使得搜索引擎在输出搜索结果的时候,可根据分词进行筛选快速得到想要得到的结果,对于用户进行搜索更加便捷和快速,减少了用户搜索的工作量。